© BUNDESREPUBLIK 
DEUTSCHLAND 




® Off nlegungsschrift 
® DE 19840 771 A1 



DEUTSCHES 



@ Aktenzeichen: 
@ Anmeldetag: 
@ Offenlegungstag: 



198 40 771.8 
7. 9.1998 
10. 2.2000 



® Int.CI. 7 : 

C 12 N 9/12 

C 07 K 19/00 
C 12 P 19/34 
C 12 N 15/62 
C 12 N 15/63 
C 12 Q 1/68 



PATENT- UND 




MARKENAMT 




(56) Innere Prioritat: 


@ Erfinder: 


198 35 653.6 06.08. 1998 

@ Anmelder: 

Lion Bioscience AG, 69120 Heidelberg, DE 


Voss, Hartmut, Dr., 69221 Dossenheim, DE; 
Moeckel, Gerd, Dr., 68723 Oftersheim, DE; Kober, 
Ingo, Dr., 69251 Gaiberg, DE; Kilger, Christian, Dr., 
69121 Heidelberg, DE 


© Ve Ureter: 




BOEHMERT & BOEHMERT, 28209 Bremen 





o 

00 
O) 

Ul 

Q 



Die folgenden Angaben sind den vom Anmelder eingereichten Unterlagen entnommen 

@ Thermostabiler in vitro-Komplex mit Polymeraseaktivitat 

® Ein erfindungsgemafcer thermostabiler in vitro-Kom- 
plex zur Template-abhangigen Elongation von Nuklein- 
sauren umfa&t ein thermostabtles Gleitklammerprotein, 
welches mit einem thermostabilen Polymeraseaktivitat 
aufweisenden Elongationsprotein verbunden ist. Ein er- 
findungsgemaSer thermostabiler akzessorischer in vitro- 
Komplex enthalt ein Gleitklammerprotein und ein Kopp- 
lungsprotein und kann mit geeigneten Polymerasen kom- 
biniert werden. Die erfindungsgema&en in vitro-Komple- 
xe konnen in Verfahren zur Template-abhangigen Elonga- 
tion von Nukleinsauren, insbesondere z. B. der PCR-Reak- 
tion, eingesetzt werden. Entsprechende Reagenzienkits 
werden ebenfalls beschrieben. 
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Beschreibung 

Die Erfindung betrifft einen thermostabilen in vitro-Komplex zur Template-abhangigen Elongation von Nukleinsau- 
ren, einen thermostabilen prokaryontischen akzessorischen in vitro Komplex sowie dafur codierende DNA-Sequenzen 

5 und Vektoren. Die Erfindung betrifft weiterhin die Verwendung der erfindungsgemaBen Komplexe in Verfahren zur Tem- 
plate-abhangigen Elongation von Nukleinsauren, wie PCR-Reaktionen oder der DNA Sequenzierung, bei denen in vitro 
Tcmplatc-abhangigc DNA Strangsynthcsc crfolgt. SchlicBlich betrifft die Erfindung noch Rcagcnzicnkits zur Durchfuh- 
rung der erfindungsgemaBen Verfahren. 

DNA Polymerasen gehoren zu einer Gruppe von Enzymen, die einzelstriingige DNA als Template fur die Synthese ei- 

10 nes komplementaren DNA Stranges verwenden. Diese Enzyme spielen eine bedeutende Rolle im NukleinsaurestofF- 
wechsel, einschlieBlich der Prozesse DNA Replikation, Reparatur und Rekombination. DNA Polymerasen wurden in al- 
ien zellularen Organismen identifiziert, von bakteriellen bis zu menschlichen Zellen, in vielen Viren sowie in Bakterio- 
phagen (Kornberg, A. & Baker, T. A. (1991) DNA Replikation WH Freeman, New York, NY). Man faBt in der Regel die 
Archaebakterien und die Eubakterien zusammen zu der Gruppe der Prokaryonten, der Organismen ohne echtem Zell- 

15 kern, und stellt ihnen die Eukaryonten, die Organismen mit echtem Zellkem, gegeniiber. Gemeinsam sind vielen Poly- 
merasen aus den verschiedensten Organismen oftmals Ahnlichkeiten in der Aminosauresequenz sowie Ahnlichkeiten in 
der Struktur (Wang, J., Sattar, A.K.M.A.; Wang, C.C., Karam, J.D., Konigsberg, W.H. & Steitz, T.A. (1997) Crystal 
Structure of pol a familily replication DNA polymerase from bacteriophage RB69.Cell 89, 1087-1099). Organismen wie 
der Mensch besitzen eine Vielzahl von DNA abhangigen Polymerasen, von denen jedoch nicht alle fur die DNA Repli- 

20 kation zustandig sind, sondern einige auch DNA Reparatur durchfiihren. Replikative DNA Polymerasen bestehen meist 
aus Protein komplexen mit mehreren Untereinheiten, welche die Chromosomen der zellularen Organismen und Viren re- 
plizieren. Eine generelle Eigenschaft dieser replizierenden Polymerasen ist im allgemeinen eine hohe Prozessivitat, das 
heifil, deren Fahigkeil, Tausende von Nukleotide zu polymerisieren ohne vom DNA Template abzudissoziieren (Rom- 
berg, A. & Baker, T. A. (1991) DNA Replikation. WH Freeman, New York, NY). 

25 Bis vor kurzem waren die einzigen gut verstandenen, hochprozessiven Replikations-Mechanismen in Zellen solche, 
die von zellularen Replikasen (einem Protein-Komplex mit Polymerase- Aktivitat) verwendet wurden, sowie der Repli- 
kationsapparat des Bakteriophagen T4 oder T7. Der dem Mechanismus zugrunde liegende Apparat beinhaltet ein Protein 
mit ringahnlichcr Struktur, cine "Gleitklammer", wclchc die DNA umschlicBt. und die katalyt.ischc Polymcrasccinhcit - 
das "Elongadonsprotcin** - an die DNA bindct (vStukcnbcrg, P.T., Studwcll-Vaughan, P.S.& ODoncll, M. (1991) Mccha- 

30 nism of the p-clamp of DNA polymerase m holoenzyme. J. Biol. Chem. 266, 11328 11334; Kuriyan, J. & ODonnel, M. 
(1993) Sliding clamps of DNA polymerases. J. Mol. Biol. 234, 915 925). Die Gleitklammer ist haufig tiber ein oder 
mehrere weitere Proteine, den "Kopplungsproteinen", an das Elongationsprotein gebunden. Die dreidimensionale Struk- 
* tur von verschiedenen Gleitklammerproteinen wurde bereits besdmmt: 

35 - die des eukaryontischen proliferating cell nuclear antigen (PCNA) (Krishna, T.S.R., Kong, X.-P, Gary, S., Bur- 

gers, P. M. & Kuriyan, J. (1994) Crystal structure of the eukaryotic DNA polymerase processivity factor PCNA. 
Cell 79, 1233-1243; Gulbis, J. M., Kelman, Z., Hurwitz, J., O'Donnel, M. & Kuriyan, J. (1996) Structure of the C- 
terminal region of p21 WAF1/OP1 complexed with human PCNA. Cell 87, 297-306), 

- die der p Untcrcinhcit. der Polymerase TIT des Euhakrcriums Escherichia coli), (Kong, X.-P, Onrust, R., OT)on- 
40 nell, M. & Kuriyan, J. (1992) Three dimensional structure of the p subunit of Escherichia coli DNA polymerase E3 

holoenzyme; a sliding DNA clamp. Cell 69, 425 437) 

- und die des Bakteriophagen T4 Gen45 Proteins (Kelman, Zvi, Hurwitz, J. ODonnel, Mike (1998) Structure, 6, 
121-125). 

45 Die Gesamtstruktur dieser Gleitklammern ist sehr ahnlich; die Bilder der Proteingesamtstruktur von PCNA, der P-Un- 
tereinheit und der gp45 Ringe sind ubereinandergelegt deckungsgleich (Kelman, Z. & O'Donnell, M. (1995) Structural 
and functional similarities of prokaryotic and eukaryouc sliding clamps. Nucleid Acids Res. 23, 3613-3620). Jeder Ring 
hat vergleichbare Dimensionen und eine zentrale Offnung, die groB genug ist, um Duplex-DNA, also einen DNA Dop- 
pelstrang, bestehend aus den zwei komplementaren DNA Strangen, zu umschliefien. 

50 Die Gleitklammer kann sich in vivo nicht sclbst um die DNA hcrum positionicrcn; sic muB durch cincn Klammcrladcr 
um die DNA fixiert werden. Dieser Klammerlader ist ein Protein komplex, der in Prokaryonten und Eukaryonten aus ei- 
ner Vielzahl von Untereinheiten besteht und der beim Eubakterium Escherichia coli yKomplex beziehungsweise beim 
Menschen Replikationsfaktor C (RF-C) genannt wird (Kelman, Z. & O'Donnell, M. (1994) DNA replication - enzymo- 
logy and mechanisms. Cum Opin. Gent. Dev. 4, 185-1 95). Der Gleitklammerlader erkennt das 3-Ende des Einzelstrang- 

55 Duplexes (Primer-Template) und positionierl die Gleitklammer in Anwesenheil von ATP um die DNA. Die Gleitklam- 
mer, welche die DNA dann umschlieBt, wechselwirkt nut Polymerasen, und gewahrleistet so eine schnelle und prozes- 
sive DNA Synthese. 

Im Falle des Bacteriophagen T7 wird das gleiche Ziel, eine prozessive DNA Synthese, mittels eines strukturell ande- 
ren Proteinkomplexes erreicht. Der Phage exprimiert eine eigene katalytische Polymerase, die T7 Polymerase, das Pro- 

60 dukt des gene 5, wclchc mit einem Protein aus dem Wirt. Escherichia coli, dem Thiorcdoxin cine Bindung cingcht. und als 
Rcplikasc cine hochprozessive DNA Replikation crmoglicht (Proc Nad Acad Sci USA 1992 Oct 15; 89(20): 9774-9778 
Genetic analysis of the interaction between bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Hima- 
wan JS, Richardson CC). Auch hierbei kommt es zur Klammerbildung, jedoch weist diese Klammer nicht die gleiche 
Struktur auf, wie z. B. im Falle des eukaryontischen PCNA. 

65 Oft ist es noug - wie zum Beispiel im Falle der humanen Polymerase S -, dafi Proteine (Kopplungsproteine) die Ver- 
bindung zwischen dem katalytisch aktiven Teil der Polymerase und dem Prozessivitatsfaktor (Gleitklammer) schaffen. 
Beim Menschen ist dies die kleine Untereinheit der 5-Polymerase (Zhang, S.-J., Zeng, X.-R., Zhang, P., Toomey, N.L., 
Chuang, R.Y., Chang, L.-S., and Lee, M.Y.W.T. (1994). A conserved region in the amino terminus of DNA polymerase 5 
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is involved in proliferating cell nuclear antigen binding. J. Biol. Chem. 270, 7988-7992). Im Falle der T7 Polymerase je- 
doch bindet der Prozessivitatsfaktor die katalytische Einheit der Polymerase direkt. 

DNA Polymerasen werden unter anderem durch zwei Eigenschaften charakterisiert, ihre Elongationsrate, das heiBt die 
Anzahl der Nukleotide die sie pro Sekunde in einen wachsenden DNA Strang inkorporieren konnen und ihre Dissoziati- 
onskonstante. Wenn die Polymerase nach jedem Inkorporationsschritt eines der Nukleotide in die wachsende Kette wie- 5 
der vom Strang abdissoziiert, (d. h. ein Elongationsschritt erfolgt pro Dindungsereignis), dann hat die Prozessivitat den 
Wert. 1 und die Polymerase ist nicht. prozessiv. Wcnn die Polymerase fiir wicdcrholtc Nuklcinsaurcinkorporationcn mit 
dem Strang verbunden blcibt, dann wird der Rcplikationsmodus als prozessiv bczcichnct und kann cincn Wert von mch- 
reren Tausend erreichen (siehe hierzu auch: Methods in EnzymoLogy Volume 262, DNA Replication, Edited by J. L. 
Campbell, Academic press 1995, pp. 270 280). io 

Fiir die meisten in vitro Anwendungen, wie PGR oder Sequenzierungsprozesse ist Prozessivitat eine wiinschenswerte 
Eigenschafu die allerdings die bislang in diesen Reaktionen eingesetzten thermostabilen Enzyme nur in geringem MaBe 
besitzen, wohingegen die temperatursensitive, nut Thioredoxin assoziierte T7 Polymerase eine Prozessivitat von einigen 
tausend Nukleotiden hat. im Vergleich - die thermostabile DNA Polymerase aus Thermus thermophilus oder aquaticus 
haben nur eine Prozessivitat von etwa 50 Nukleotiden (Biochim Biophys Acta 1995 Nov 7; 1264(2): 243-248 Inactiva- 15 
don of the 5'-3' exonuclease of Thermus aquaticus DNA polymerase. Merkens LS, Bryan SK, Moses RE). 

Die U.S. Patente 4,683,195, 4,800,195 und 4,683,202 beschreiben die Anwendung solcher thermostabilen DNA Poly- 
merasen in der Polymerase Kettenreaktion (PCR). In der PCR wird unter Verwendung von Primem, Template, Nukleo- 
tiden, einer DNA Polymerase eines entsprechenden Puffers und geeigneten Reaktionsbedingungen DNA neu syntheti- 
siert. Hierbei wird die doppelstrangige Zielsequenz zumeist thermisch aufgeschmolzen, zwei Oligonukleodde werden 20 
anhybridisiert und die Komplementarsequenz mittels der Inkorporadon von Nukleodden durch die Polymerase am Tem- 
plate synthetisiert. Das Extensionsprodukt jedes Primers dient als Template fiir den nachsten Zyklus. In dieser PCR 
konimt es bevorzugl zur Verwendung einer Ihermostabilen Polymerase, welche das zyklische, Ihenmsche Aufschmelzen 
der DNA Strange ubersteht. So wird haufig Taq DNA Polymerase verwendet (U.S. Patent 4,965,188). Die Prozessivitat 
der Taq DNA Polymerase ist jedoch wie oben ausgefuhrt reiadv gering im Vergleich zur '17 Polymerase. 25 

DNA Polymerasen finden auch in der DNA Sequenzbesdrnmung Anwendung (Sanger et al., Proc. Natl. Acad. Sci., 
USA 74: 5463-5467 (1997)). Haufig wird bei der Sequenzierung nach Sanger eine T7 DNA Polymerase verwendet (Ta- 
bor, S. und Richardson, C.C Proc. Natl. Acad. Sci., USA 86: 4076-4080 (1 989)). Sparer wurdc das Cyclc-Scqucncing- 
Vcrfahrcn cntwickclt (Murray, V. (1989) Nucleic Acids Res. 17, 8889), welches kcin cinzclstrangigcs Template crfordcrt 
und die Initiierung der Sequenzreakdon mit verhaltnismaBig geringen Mengen an Template erlaubt. Die hierbei zur Ver- 30 
wendung kommenden Polymerasen konnen z. B. die oben erwahnte Taq Polymerase sein (U.S. Patent 5,075,216) oder 
die Polymerase von Thermotoga neapolitana (WO 96/10640) oder andere thermostabile Polymerasen. Neuere Verfahren 
koppeln die exponendelle Amplifikation und die Sequenzierung eines DNA Fragmentes in einem Schritt, so daB es mog- 
lich ist, genomische DNA direkt zu sequenzieren. Eines der Verfahren, das sogenannte DEXAS-Verfahren (Nucleic 
Acids Res 1997 May 15; 25(10): 2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, 35 
Paabo S, Biol Chem 1997 Feb; 378(2): 99-105 Direct exponential amplification and sequencing (DEXAS) of genomic 
DNA. Kilger C, Paabo S und DE 196 53 439.9 sowie DE 196 53 494.1) verwendet eine Polymerase mit verminderter 
Diskriminierungsfahigkeit gegeniiber Dideoxynukleotiden (ddNTPs) im Vergleich zu Deoxynukleotiden (dNTPs) sowie 
cincn Rcaktionspuffcr, zwei Primer, die prcfcrcnticll nicht cquimolar vorlicgcn, und die oben genannten Nukleotide, um 
dann in mehreren Zyklen eine komplette, sequenzspezifische DNA Leiter eines Fragmentes zu erhalten welches von den 40 
Primem umspannt ist. Eine Weiterentwicklung dieses Verfahrens besteht in der Verwendung eines Polymerasegemi- 
sches, wobei eine der beiden Polymerase zwischen ddNTPs und dNTPs diskriminiert, wahrend die zweite eine verrnin- 
derte Diskriminierungsfahigkeit aufweist (Nucleic Acids Res 1997 May 15; 25(10): 2032-2034 Direct DNA sequence 
determination from total genomic DNA. Kilger C, Paabo S). 

DNA Polymerasen finden auch Anwendung in der reversen Transkription von RNA in DNA. Hierbei dient RNA als 45 
Template und die Polymerase syndietisiert einen komplementaren DNA Strang. Zur Anwendung kommt hier z. B. die 
thermostabile DNA Polymerase aus dem Organismus Thermus thermusphilus (Tth) (U.S. Patent 5,322,770). 

Es kann zudem erwiinscht sein, daB die Polymerase eine 'proof- reading* Aktivitat besitzt, also eine 3-5' Exonuklease- 
aktivitat aufweist. Diese Eigenschaft ist insbesondere dann wunschenswert, wenn das zu synthetisierende Produkt mit ei- 
ner nicdrigen Fchlcrratc bei der Nuklcotidinkorporadon hcrgcstcllt werden soil. 50 

Die oben genannten Enzyme, die ublicherweise in PCR-Reaktionen eingesetzt werden, gehoren groBtenteiis nicht zu 
den eigentlichen Replikationsenzymen, sondem es sind zumeist Enzyme, von denen man annimmt, daB sie an der DNA 
Reparatur beteiligt sind, weshalb deren Prozessivitat relativ gering ist. 

Somit war es Aufgabe der vorliegenden Erfindung, mehrere der vorgenannten Eigenschaften von Polymerasen, insbe- 
sondere hohe Prozessivitat und Thermostabilitat fur die Verwendung in in vitro Reaktionen zu vereinen. 55 

Diese Aufgabe wurde erfindungsgemaB geldst durch die Bereitstellung eines thermostabilen in vitro-Komplexes zur 
Template-abhangigen Elongation von Nukleinsauren, umfassend ein thermostabiies Gleitklammerprotein, welches mit 
einem thermostabilen Polymeraseaktivitat-aufweisenden Elongationsprotein verbunden ist. Dieser Komplex kann in in 
vitro-Reaktionen, wie z. B. in PCR-Reaktionen, eingesetzt werden und weist dabei eine hohe Prozessivitat auf. \forteil ist 
zudem, wcnn der Komplex cine gcringc Fchlcrquotc bei der Nuklcotidinkorporadon aufweist, also cine crhohtc Fidelity 60 
hat. Dieser Komplex kann somit bei der Elongation, der Amplifikation und der Sequenzierung von Nukleinsauren einge- 
setzt werden. Dieser Komplex ist vorzugsweise in Standard-PCR-Reaktionen einsetzbar. 

Um die Verwendbarkeit eines solchen Komplexes in Standard-PCR-Reaktionen zu ermoglichen, muB eine einfache 
Handhabung gewahrleistet sein. So wurde zwar der Replikationsapparat des Simian virus 40 bereits in vitro zusammen- 
geselzt (Wage, S. & Stillman, B. (1994) Nature, Vol. 369, 207-221), jedoch fur Standard-PCR-Reaktionen ist dieser Re- 65 
plikationsapparat nicht geeignet, da er unter anderem nicht thermostabil ist Es ist somit Gegenstand der Erfindung, einen 
thermostabilen in vitro-Komplex mit Polymeraseaktivitat bereitzustellen, der in S tandard-PCR-Reaktionen einsetzbar ist 
und der eine hohe Prozessivitat aufweist. 
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Insbesondere ist Gegenstand der Erfindung ein thermostabiler prokaryontischer in vitro Komplex zur Elongation von 
Nukleinsauren, der ein thennostabiles Gleilklaimiierprolein, welches die komplementaren Nukleinsaurestrange ganz 
oder teilweise umschlieBt, und ein thennostabiles, Polymeraseaktivitat aufweisendes Protein umfaBt, wobei dieses Pro- 
tein oder dieser Proteinkomplex mit dem Gleitklammerprotein gekoppeltist 
5 Im Rahmen der vorhegenden Erfindung umfaBt der Begriff Poiymeraseaktivitat-aufweisendes Elongationsprotein 
auch Polymeraseaktivitat-aufweisende Proteinkomplexe oder Untereinheiten solcher Komplexe, welche die Polymera- 
seaktivitat tragcn. . , , . . . ™_ 

Thcrmostabil im Sinne der vorUcgcndcn Erfindung bedcutet, dafi der akzessonsche Komplex mithohcr Prozessivitat 
Nukleotide in wachsende Nukleinsaurestrange inkorporiert sowohl bei niedrigen als auch bei hohen Temperaturen, die in 
10 der PGR oder einer anderen Reaktion auftreten, wie z. B. der DNA Sequenzierung. 

Die PGR besteht z B in der Regel aus den Schritten der Denaturierung (70°C bis 98°C), dem Anneahng (40 C bis 
78°Q und der DNA Strangsynthese (60°G bis 76°G). Somit muB dieser Komplex mindestens zwischen ca 60 C und ca 
70°C insbesondere zwischen 60°C und 76°C und besonders bevorzugterweise funktionsfahig sein zwischen 40 C und 
98°C Es diirfen wahrend der gesamten Reaktion keine irreversiblen Denaturierungserschemungen des Komplexes oder 
15 einzemer Komponenten auftreten, welche die Elongationsreaktion unterbinden oder inhibieren. 

Die Kopplung zwischen Gleitklammerprotein und Polymeraseaktivitat aufweisendem Elongationsprotein kann durch 
kovalente, aber auch durch nicht-kovalente Bindung erfolgen. In einer bevorzugten Ausfuhrungsform sind Gleitklam- 
merprotein und Elongationsprotein fiber ein Kopplungsprotein verbunden. 

In einer weiteren bevorzugten Ausfuhrungsform der vorliegenden Erfindung stammen im erfindungsgemaBen thermo- 
stabilen in vitro Komplex die assoziierten Proteine aus Archaebakterien. Es ist allerdings im Rahmen der vorhegenden 
Erfindung ebenfalls mogUch, dafi die assoziierten Proteine aus Eubakterien stammen. Gegenstand der vorhegenden Er- 
findung ist ebenfalls ein erfindungsgemaBer thermostabiler in vitro Komplex, bei dem die assozuerten Proteine zum Teil 
aus Archaebakterien und zum Teil aus Eubakterien stammen. 

Im Sinne der vorliegenden Ernndung urnfaBt der Begriff prokaryontisches Protein sowohl Proteine aus Archaebakte- 
rien und Proteine aus Eubakterien. Es ist bekannt, dali der Replikationsapparat in Archaea dem des eukaryonuschen Re- 
plikationsapparates ahnlich ist, obwohl die Genomorganisation in Eukaryonten und Archaea ganznch verschieden ist 
und die zeUulare Stniktur der Eubakterien dem der Archaea ahnelt. (Edgell, D.R. and DooUttle, W.F. (1 997). Archaea and 
the oriein(s) of DNA replication proteins. Cell 89, 995-998). , . 

Dcswcitcrcn ist cine bcvorzugtc Ausfuhrungsform der vorUcgcndcn Erfindung cin thermostabiler prokaryontischcr in 
vitro Komplex bei dem ein Polvmeraseaktivitat-aufweisender Proteinkomplex vorliegt, der aus emem Kopplungspro- 
tein und einem oder mehreren Polymeraseaktivitat-aufweisenden Elongationsprotein besteht. Bevorzugt ist desweiteren 
ein erfindungsgemaBer thermostabiler prokaryontischer in vitro Komplex, bei dem das Gleitklammerprotein eine nng- 
formige Struktur aufweist, welches die komplementaren Nukleinsaurestrange ganz oder teilweise umschlieBt. 
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Die Gleitklammer 



Die folgenden Ausfuhrungen sollen dazu dienen, die Funktion und die mogUchen Erscheinungsformen des Gleitkiam- 
merproteins besser zu verstehen. t 

Das Gleitklammerprotein crfullt. die Funktion, die Polymeraseaktivitat an die DNA zu bmden. En tweder umschlieBt 
das Gleitklammerprotein selbst die DNA ganz oder teilweise oder durch Assoziation an das Polymeraseaktivitat aufwei- 
sende Protein beziehungsweise an den Polymeraseaktivitat- auf weisenden Proteinkomplex oder seine Untereinheit wird 
eine Klammer gebildet. In jedem FaU wird durch diese Klammerbildung die Prozessivitat significant gesteigert. minde- 

stens um das eineinhalbfache. i«u 

Das heiBt der erfindungsgemaBe in vitro Komplex besilzt eine mindestens eineinhalbfache Prozessivitat mi \fergleich 
zum Elongationsprotein aUeine, beziehungsweise im Vergleich zu einem Polymeraseaktivitat aufweisenden Protein 
komplex ohne Gleitklammer oder einer Untereinheit davon. 

Als Gleitkammer konnen beispielsweise Homologe des "ProUferating Cell Nuclear Antigen" -Proteinkomplex aus dem 
humanen Genom, oder Homologe des ebenfaUs ringfdrmigen "P-clamp" -Proteinkomplex aus E. coh dienen, welche aus 
thermostabilen Organismen stammen und somit thermostabil sind, oder aus nicht thermostabilen Orgamsmen stammen, 
und nachtragUch durch Vcrandcrung der Aminosaurcscquenz thcrmostabil gemacht wurden (Eijsmk VG, van der Zee .JK, 
van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22; 282(1): 13-16, Improving the thermostability of the neu- 
tral protease of Bacillus stearothermophilus by replacing a buried asparagine by leucine, Bertus Van den Burg . Gert 
Vriend Oene R. Veltman, Gerard Venema, and Vincent G. H. Eijsink Engineering an enzyme to resist boiling TNAfc 
1998 95- 2056-2060) Dabei kann die Gleitklammer aus mehreren Komponenten aufgebaut sein. Die im menschlicnen 
Genom identifizierte Gleitklaimner besteht aus drei PCNA-Protein Komponenten (SEQ ID NO: 11) (Homoirimeies), die 
im E coU Genom identifizierte Gleitklammer besteht aus zwei Komponenten (SEQ ID NO: 35) (Homodimeres). 

Als Gleitklammer im Sinne der vorUegenden Erfindung ist hierbei insbesondere jedes Protein zu verstehen, das die 
funktioneUe Eigenschaft der Polymeraseprozessivitatssteigerung besitzt oder der Senkung der Fehierrate dient. Dazu 
kann die Gleitklammer eine ringformige dreidimensionale Struktur aufweisen oder durch Kopplung an em i anderes Pro- 
60 tcin ringformige dreidimensionale Struktur bilden, durch die sic in der T^gc ist, cin- und doppclstrangigc DNA ganz oder 
teilweise zu umschUcBcn. 

Als Gleitklammer im Sinne der vorUegenden Erfindung ist insbesondere ein solches Protem zu verstehen, das 

1 zu der menschUchen (Eukaryonten) PCNA Aminosauresequenz (SEQ ID NO: 11) auf einer Lange yon minde- 
65 stens 100 Aminosauren bei einem Sequenzalignment eine mindestens 20%ige SequenzidenUlat aufweist oder das 

2 zu der bakterieUen P-clamp Sequenz aus E. coU (Eubakteria) (SEQ ID NO: 35) auf einer Lange von mindestens 
100 Aminosauren bei einem SequenzaUgnment eine mindestens 20%ige Sequenzidentitat autweist oder das 

3 zu der Aminosauresequenz des PCNA Homologen aus Archaeoglobus Fulgidus (Archaea) (SEQ ID NO: 12) aut 
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einer Lange von mindestens 100 Aminosauren bei einem Sequenzalignment eine mindestens 20%ige Sequenziden- 
tilal aufweist. 

Die ernndungsgemalie Gleitklammer kann eines oder mehrere der vorgeaannten Merkmale aufweisen. 
Die in Abb. 1 aufgefuhrten Sequenzidentitaten wurden mit dem BLAST Algorithmus nach Altschul, S.F., Gish, W., 
Miller W Mvers E W and Lipman, D.J., J. MoL Biol. 215, 403-410 (1990) ermittelt und werden weiter unten erlau- 
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Als Glcitklammcr im Sinne dcr vorlicgcndcn Erfindung sind auBcrdcm Protcinc zu verstehen, die cine odcr bcidc dcr 
folgenden Konsensussequenzen beinhalten und an nichl mehr als vier Positionen von einer dieser Sequenzen abweichen 
(Abb. 4): 

Region 1 
(SKQIDNO: 39) 

[CAVLIMPrW]-D.X-X-X-[GAVLIMPrW]-X-X-[GAVLIMPFW]^ 
M P F W]-X-X-X-X-F-X-X-Y-X-X-D und/oder 

Region 2 
(SEQ ID NO: 40) 

[G A V L I M P F Wl-X(3)-I^A-P-fK R H D E1-[G A V L I M P F Wl-E. 

Die Aminosauren werden hierbei gemaB der Standard IUPAC Einbuchstaben Nonienklamr benannt und gemaB dem 25 
Prosite Pattern Beschreibungsstandard aufgefuhrt. Dabei sind die folgenden Aminosauregruppen haufig zusammenge- 
faBt: 

G, A, V, L, T, M, P, F odcr W (Aminosauren mit nicht polarcn Scitcnkctt.cn) 
S, T, N, Q, Y, odcr C (Aminosaure mit ungciadenen polarcn Scitcnkcttcn) 
K, R, H, D oder E (Aminosaure mit geladenen und polaren Seitenketten) 

AuBerdem bedeutet X in den Sequenzprotokollen jede beliebige Aminosaure oder Insertion oder Deletion. 

Aus dem in Abb. 12 dargestellten multiplen Alignment von menschlichen PCNA Homologen wurde zudem ein Hid- 
den Markov Modell generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Pro- 
tein zu verstehen, daB mit dem so erzeugten Hidden Markov Modell einen Score mehr als 20 aufweist (Abb. 12). Die 
Hidden Markov Modelle und die entsprechenden Scores wurden mit dem hmmfs Programm (Version 1.8.4, July 1997) 
aus dem HMMER Paket berechnet (HMMER Protein and DNA Hidden Markov Models (Version 1.8) von Sean Eddy, 
Dept. of Genetics, Washington University School of Medicine, St. Louis, USA). 

Aus dem in Abb. 13 dargestellten multiplen Alignment von E. cob" p-clamp Homologen wurde ein Hidden Markov 
Modell gencricrt. Als Glcitklammcr im Sinnc dcr vorlicgcndcn Erfindung ist somit. insbesondere jedes Protein zu verste- 
hen, das mit dem so erzeugten Hidden Markov Modell einen Score von mehr als 25 aufweist (Abb. 13). 40 

Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein, die durch eine charakteristische Bindung fest an- 
einander gebunden sind, so daB ein stabiler ringfdrmiger Molekulkomplex gebildet wird, der nicht ohne Weiteres von der 
DNA dissoziieren kann. Dadurch wird eine feste aber nicht kovalente Bindung an die DNA ermoglicht, die freie Ver- 
schiebbarkeiL auf derselben aber nicht behindert. Die prozessiviliiLssteigemden GleiLklammerproteine haben zudem cha- 
rakteristische lokale Molekuleigenschaften im Bereich der Wechselwirkungsregion zur DNA, welche die freie Ver- 
schiebbarkeit erleichtem und die durch in diese Region eingelagerte Wassermolekule unterstutzt werden kann. 

Eine bevorzugte Ausriihrungsform der vorliegenden Erfindung ist weiterhin insbesondere ein thermostabiler prokary- 
ontischer in vitro Komplex, wobei das Gleitklammerprotein eines der folgenden ist: AF0335 aus Archaeoglobus Fulgi- 
dus, MJ0247 aus Methanococcus Jannaschii, PHLA008 aus Pyrococcus Horikoschii, MTH1312 aus Methanobacterium 
Thcrmoautotrophicus sowic AE000761J7 aus Aquifcx Acolicus. 

Insbesondere sind thermostabile prokaryontische in vitro Komplexe vom Gegenstand dieser Anmeldung umfaBt, wo- 
bei das Gleitklammerprotein eine Aminosauresequenz gemaB SEQ ID No. 11, 12, 13, 14, 15 und 36 (Aquifex Aeolicuc) 
aufweist 

Der Gleilklammerlader 55 

Desweiteren ist als bevorzugte Ausfuhrungsform zu verstehen, wenn zu diesem erfindungsgemaBen Komplex zusatz- 
lich ein Gleitklammerlader gehort, welcher die Komponenten der Gleitklammer um den ununterbrochenen DNA-Strang 
herum zusammenfugt, bzw. diese wieder entfemt, wenn die Reaktion beendet wird. Dieser Gleitklammerlader ist bevor- 
zugt mit. dem erfindungsgemaBen in vitro-Komplcx assoziicrt. 60 

Im Mcnschcn bestcht dcr Gleitklammerlader aus flinf IJntcrcinhcitcn, 4 klcincn ((xlcitklammcrladcr 1) und cincr gro- 
Ben Untereinheit (Gleitklammerlader 2). Als Gleitklammerlader dienen erfindungsgemaB beispielsweise ein oder meh- 
rere prokaryontische Homologe des im Menschen identifizierten "Replication Factor C M -Proteinkomplexes (Gleitklam- 
merlader 1 : SEQ ID NO: 1 , 32, 33, 34 und Gleitklammerlader 2 SEQ ID NO: 6). 

Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das 65 
zu der menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 1, 32, 33, 34) auf einer Lange von mindestens 
100 Aminosauren bei einem Sequenzalignment eine mindestens 20%ige Sequenzidentitat aufweist 

Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung ist insbesondere auch ein solches Protein zu verstehen, 
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das zu der menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 6) auf einer Lange von mindestens 150 Ami- 
nosauren bei einem Sequenzalignmenl eine mindestens 20%ige Sequenzidendtat aufweisl. 

Als Klammerlader sind beispielsweise die in Abb. 1 aufgefuhrten Homologe aus Archaebakterien geeignet (SEQ ID 
NO: 3, 4, 5; Homologe zu Gleitkiammerlader 1 und SEQ ID NO: 8, 9, 10, Homologe zu Gleitklammerlader 2). Daher ist 
5 insbesondere bevorzugt ein thermostabiler prokaryotischer in vitro Komplex, wobei zusatzlich ein RFC-homologes Pro- 
tein bzw. Proteinkomplex anwesend ist. 

Als Gleitklammerlader 1 im Sinnc der vorlicgcndcn Erfindung ist daher beispielsweise jedes Protein zu verstchen, das 
die folgcndcn Konscnsusscqucnzcn bcinhaltct und an nicht mchr als vicr Positioncn von dicscr Sequenz abweicht (Abb. 
6): 

10 

SEQ ID NO: 41 

C-N-Y-X-S-1K R H D El-I-I-X-fG A V L I M P F W1-[G A VLIMPF W]-Q-S-R-C-X-X-F-R-F-X-P-fG A V L I M P F 
WJ. 

15 

Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung ist daher beispielsweise auch jedes Protein zu verste- 
hen, das die folgenden Konsensussequenzen beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz ab- 
weicht (Abb. 7): 

20 SEQ ID NO: 42 

K-X-X-L-L-X-G-P-P-G-X-G-K-T-[S T N Q Y C]-X-[G A V L I M P F W]-X-X-[G AVLIMPFW]. 

Aus deni in Abb. 14 dargestellten multiplen Alignment von menschlichen Gleitklammerlader 1 Homologen wurde zu- 
25 dem ein Hidden Markov Modell generiert. Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung ist somit jedes 
Protein zu verstehen, das mit dem so erzeugten Hidden Markov Modell einen Score mehr als 25 aufweist (Abb. 14). 

Aus dem in Abb. 15 dargestellten multiplen Alignment von menschlichen Gleitklammerlader 2 Homologen wurde zu- 
dem ein Hidden Markov Modell generiert. Als Gleitklammerlader 2 im Sinnc der vorliegenden Erfindung ist somit jedes 
Protein zu verstchen, das mit dem so erzeugten Hidden Markov Modell cincn Score mchr als 15 aufweist (Abb. 15). 
30 Bevorzugt ist ebenfalls, wenn ein dem Eubakterium Escherichia coli y-Komplex homologes Protein als Gleitklammer- 
lader anwesend ist 

AuBerdem bevorzugt ist ein erfindungsgemaBer thermostabiler in vitro Komplex zur Elongation von Nukleinsauren, 
bei dem neben dem Gleitklammerlader zusatzlich ATP vorliegen kann, vorzugsweise ebenfalls assoziiert. 

35 Das Kopplungsprotein 

Das Kopplungsprotein hat die Funktion, das Elongationsprotein und das Gleitklammerprotein zu verbinden. Als 
Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere jedes Protein zu verstehen, welches die oben 
bcschricbcnc Funktion besitzt. Dabci sind als Kopplungsprotcinc beispielsweise die in Abb. 1 aufgefuhrten Homologe 

40 zu der humanen Sequenz der koppelnden Untereinheit (DPD2_HUMAN, [SEQ ID NO: 16]) aus Archaebakterien geeig- 
net (SEQ ID NO: 17, 18, 19, 20, 21). 

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu 
der menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 16) auf einer Lange von mindestens 150 Arninosau- 
ren bei einem Sequenzalignment eine ndndestens 18%ige Sequenzidendtat aufweisl. 

45 Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist daher jedes Protein zu verstehen, das die folgende 
Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Abb. 5): 

SEQ ID NO: 43 

50 [FL]-[G A V L I M P F W]-X-X-[G A V L I M P F W]-X-G-X(13)-[G A V L I M P F W]-X-[YR]-[G AVLIMPFW]- 
X-[G A V L I M P F W]-A-G-[DN]-[G AVLIMPF W]-[G A V L I M P F W]-[DS]. 

Aus dem in Abb. 16 dargestellten multiplen Alignment von Homologen zur menschlichen koppelnden Untereinheit 
wurde zudem ein Hidden Markov Modell generiert. Als koppelnde Untereinheit im Sinne der vorliegenden Erfindung ist 
55 soinil jedes Protein zu verstehen, das mit dem so erzeugten Hidden Markov Modell einen Score mehr als 10 aufweist 
(Abb. 16). 

Polymeraseaktivitat-aufweisendes Elongationsprotein bzw. Polymeraseaktivitat aufweisender Enzymkomplex bzw. Un- 
tereinheit davon 

60 

Einigc Elongadonsprotcinc benotigen die Anwcscnhcit cincs Kopplungsprotcins (koppelnde Untereinheit), um iibcr- 
haupt Polymeraseaktivitat aufzuweisen. Es ist aber auch vorstellbar, dafi das Elongationsprotein direkt an die Gleitklam- 
mer bindet. Andere Elongationsproteine benotigen die Anwesenheit eines Kopplungsproteins fur die Bindung an die 
Gleitklammer. 

65 Das Elongauonsprotein weisi eine S'^'-Polymeraseaktivitat oder eine Re veree-Transkriplase-AkliviUit auf. Dabei sind 
als Elongationsproteine beispielsweise die in Abb. 1 aufgefuhrten zum menschlichen Elongationsprotein (SEQ ID NO: 
22) Homologe aus Archaebakterien geeignet (SEQ ID NO: 23, 24, 25, 26). 

Bevorzugterweise bindet das Elongationsprotein an das Kopplungsprotein, welches wiederum an das Gleitklammer- 
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protein gekoppelt isL 

Als Elongationsprotein iin Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu 
der menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 22) auf einer Lange von niindestens 200 Aminosau- 
ren bei einem Sequenzalignment eine mindestens 20%ige Sequenzidendtat aufweist. 

Als Elongationsprolein im Sinne der vorliegenden Erfindung ist daher insbesondere jedes Protein zu verstehen, das die 
folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Abb. 8): 

SEQ ID NO: 44 

D-[GAVLIMPFWHGAVLIMPF W]-X-X-Y-N-X-X-X-F-D-X-P-Y-[G A VLIMPF W]-X-X-R-A. 

Aus dem in Abb. 17 dargestellten muldplen Alignment von Homologen zum menschlichen Elongadonsprotein (SEQ 
ID NO: 22) wurde zudem ein Hidden Markov Modell generiert Als Elongadonsprotein im Sinne der vorliegenden Er- 
findung ist somit insbesondere jedes Protein zu verstehen, das mit dem so erzeugten Hidden Markov Modell einen Score 
mehr 20 aufweist (Abb. 17). . 

Als Elongationsprolein im Sinne der vorliegenden Erfindung ist insbesondere auch ein solches Protein zu verstehen, 
das zu der archaeabakteriellen Aminosauresequenz (SEQ ID NO: 27) auf einer Lange von mindestens 400 Aminosauren 
bei einem Sequenzalignment eine mindestens 25%ige Sequenzidendtat aufweist. Beispielsweise sind geeignet die aus 
Archaebakterien stammenden Proteine mit der SEQ ID NO: 28, 29, 30 oder 31. 

Als Elongadonsprotein im Sinne der vorliegenden Erfindung ist daher insbesondere auch jedes Protein zu verstehen, 20 
das die folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Abb. 
9): 

SEQ ID NO: 45 

25 

A-[GAVLIMPFW]-R-T-A-|GAV 

P F W]-V-X-A-P-[G A V L I M P F W]-E-G-I-A-X-V-[K R II D E]-L 

Aus dem in Abb. 18 dargestellten multiplcn Alignment von Homologen zum archcbaktcricllcn Elongationsprotcin - 
(SEQ ID NO: 27) wurde zudem ein Hidden Markov Modell generiert. Als Elongadonsprotein im Sinne der vorliegenden 30 
Erfindung ist somit insbesondere jedes Protein zu verstehen, das mit dem so erzeugten Hidden Markov Modell einen 
Score mehr als 35 aufweist (Abb. 18). 

Das Elongadonsprotein kann auch eubakterieDen Ursprungs sein. 

Als Elongadonsprotein im Sinne der vorliegenden Erfindung ist somit ebenfalls ein solches Protein zu verstehen, das 
zu der eubakteriellen Anunosauresequenz (SEQ ID NO: 37) auf einer Lange von mindestens 300 Aminosauren bei ei- 35 
nem Sequenzalignment eine mindestens 25%ige Sequenzidendtat aufweist. 

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher auch insbesondere jedes Protein zu verstehen, 
das die folgende Konsensussequenz beinhaltet und an nicht mehr als acht Positionen von dieser Sequenz abweicht (Abb. 

,( » 

SEQ ID NO: 46 

rGAVLIMPF W]-P-V-G-[G A V L I M P F W]-G-R-G-S-X-[G A V L I M P F W]-G-S-[G A V L I M P F W]- V-A-X- 
A-fG A VLIMPF Wl-X-I-T-D-fG A V L I M P F W1-D-P-[G A V L I M P F Wl-X-X-X-fG A V L I M P F Wl-L-F-E- 
R-F-L-N-P-E-R-rG A V L I M P F Wl-S-M-P-D. 

Aus dem in Abb. 19 dargestellten muldplen Alignment von Homologen zum eubakteriellen Elongadonsprotein (SEQ 
ED NO: 37) wurde zudem ein Hidden Markov Modell generiert. Als Elongationsprotein im Sinne der vorliegenden Er- 
findung ist somit jedes Protein zu verstehen, das mit dem so erzeugten Hidden Markov Modell einen Score mehr 20 auf- 
weist (Abb. 19). , 

Bisher wurden einige DNA Polymerasen als Elongationsproteine ohne Kopplungsprotein und ohne (jleitklammer rur 
Standard PGR Reakdonen eingesetzt, so z. B. DNA Polymerase I aus Pyrococcus furiosus (United States Patent No. 
5 545,552) oder Pyrococcus species (European Patent Applicadon No: 0 547 359 Al). Diese Enzyme zeichnen sich 
durch die Eigenschaft aus, thermostabil zu sein und haufig eine 3'-5' exonuklease Akdvitat ('proof-reading' Akdvitat) zu 
besiizen. Erst vor kurzem wurde ein Helerodimer mit Polymeraseaktivilal in Pyrocoecus furiosus entdeckt (Uemon, T, 
Sato, Y., Kato, L, Doi, H., and Ishino, Y. (1997). A novel DNA polymerase in the hyperthermophUic archaeon, pyrococ- 
cus furiosus: gene cloning, expression, and characterizadon. Genes to Cells 2, 499-512.) 

Bevorzugt ist im Rahmen der vorliegenden Erfindung, daB der erfindungsgemaBe prokaryontische in vitro Komplex 
zur Elongation von Nukleinsauren aus Proteinen besteht, die aus Archaea stammen. Das heiBt, bevorzugt ist die Verwen- 
dung cincs Glcitklammcrprotcins aus Archaebakterien. Dcswcitcrcn ist bevorzugt, daB das Elongationsprotein bcztc- 
hungsweisc ein Polymcrascaktivitat-aufwciscndcr Protcinkomplcx, wclchcr aus Elongadonsprotein und Kopplungspro- 
tein besteht, aus Archaeabakterien stammt. 

Beispiele solcher filr den erfindungsgemaBen Komplex geeigneter Proteine sind in Abb. 1 und 2 dargestellt. 

Natiirlich ist es moglich, durch Deletionen oder Mutadonen oder durch das Anfiigen von Aminosauren die Eigen- 
schaften dieser Proteine zu oplimieren. Diese veriinderten Proteine sind ebenfalls Gegenstand der vorliegenden Erfm- 65 
dung, solange sie den erfindungsgemaBen in vitro Komplex zur Elongation von Nukleinsauren bilden und die oben naher 
spezifizierten Funktionen erfullen. 

Zur Veranschaulichung des erfindungsgemaBen Komplexes dient Abb. 3, die beispielhaft den Replikationsapparat in 
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einer moglichen Variante darstellt, wobei die Gleitkammer ttber eine koppelnde Untereinheit an das ELongationsprotein 
bindeL. 

Desweiteren ist bevorzugt, daB zusatzlich zu dem erfindungsgemaBen prokaryotischen akzessorischen in vitro Kom- 
plex zwei Primer anwesend sind. Primer sind in der Regel Oligonukleotide, welche an die beiden komplementaren DNA 

5 Strange der Zielsequenz binden, wobei sie in gegensatzlicher Orientierung, ihre 3 -Enden zueinander gerichtet, den zu 
amplifizierenden Abschnitt einschlieBen. Sie dienen als Startpunkt der Amplifikation und stellen in der Regei ein freies 
3-OH Endc fur die Polymerase zur Inkorporation cincs Nuklcotidcs zur Vcrfugung. 

Wahrend der Vcrwcndung des Proteinkomplexes zur Amplification, Elongation und Scqucnzicrung licgt der crfin- 
dungsgemaBe Komplex bevorzugterweise in einem geeigneten Puffer vor. Geeignete Puffer sind solche, die fiir PGR, Se- 

10 quenzierung, Nukleinsauremarkierung und anderen in vitro Nukleinsaure Elongationsreaktionen mittels Polymerase An- 
wendung finden. Geeignete Puffer werden beispielweise beschrieben in Methods in Molecular Biology Vol. 15 Humana 
Press Totowa, New Jersey, 1993, edited by Bruce A. White. 

Wahrend der Verwendung des Proteinkomplexes zur Elongation, AmpUfikation, Reversen Iranskription oder/und Se- 
quenzierung liegt zusatzlich zu dem erfindungsgemaBen Komplex ein Gemisch aus Nukleotiden vor. Deoxynukleotide 

15 konnen aus dG'fP, dATP, dTlT und dCTP ausgewahlt werden, sind jedoch nicht auf diese beschrankt Zusatzlich konnen 
auch Derivate von Deoxynukleotiden gemaB der Erfindung verwendet werden, welche als solche Deoxynukleotide defi- 
niert sind, die in der Lage sind, durch eine thermostabile DNA Polymerase in wachsende DNA Molekiile inkorporiert zu 
werden, die in der Reaktion synthetisiert werden. Solche Derivate schlieBen Thionukleotide, 7-deaza-2'-dGTP, 7-deaza- 
2-dATP sowie Deoxyinosine Triphosphat, das auch als Ersatz Deoxynukleotid ftir dATP, dGTP, dTTP oder dCTP ver- 

20 wendet werden kann, ein, sind aber nicht auf diese beschrankt. Ebenso konnen markierte Deoxynukleotide verwendet 
werden. Alle bekannten oder/und zu dem erfindungsgemaBen Zweck geeigneten Markierungen konnen dabei vorliegen. 

Dideoxynukleotide konnen aus ddGTP, ddATP, ddTTP und ddCTP ausgewahlt werden, sind jedoch nicht auf diese be- 
schrankt. Zusatzlich konnen auch Derivate von Dideoxynukleoliden gemaB der Erfindung verwendet werden, die als sol- 
che Dideoxynukleotide definiert sind, die in der Lage sind, durch eine thermostabile DNA Polymerase in wachsende 

25 DNA Molekiile inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate konnen radioaktive Di- 
deoxynukleotide (ddATP, ddGTP, ddTTP und ddGTP) oder Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP), 
welche mit z. B. FtTC, Gy5, Gy5.5, Cy7 und Texas-Rot oder anderen markiert sind, einschtieBen, sind aber nicht auf 
diese beschrankt . Tm Rahmcn einer erfindungsgemaBen Scqucnzicrung konnen auch markierte Deoxynukleotide zusam- 
mcn mit unmarkicrtcn Didcoxynuklcotidcn cingesctzt werden. 

30 Ribonukleotide konnen aus GTP, ATP, TTP und CTP ausgewahlt werden, sind jedoch nicht auf diese beschrankt. Zu- 
satzlich konnen auch Derivate von Ribonukleodden gemaB der Erfindung verwendet werden, die als solche Ribonukleo- 
tide definiert sind, die in der Lage sind, durch eine thermostabile DNA Polymerase in wachsende DNA Molekiile inkor- 
poriert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate konnen radioaktive Ribonukleotide (ATP, 
GTP, TTP und GTP) oder Ribonukleotide (ATP, GTP, TTP und GTP), welche mit z. B. HTG, Gy5, Cy5.5, Gy7 und Te- 

35 xas-Rot oder anderen markiert sind, einschlieBen, sind aber nicht auf diese beschrankt. 

Wahrend der Verwendung des Proteinkomplexes zur Amplifikation, Elongation und Sequenzierung kann es sich als 
vorteilhart erweisen wenn bei der Reaktion eine Pyrophosphatase anwesend ist. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein thermostabiler, akzessorischer in vitro-Komplex, welcher 
ein Glcitklammcrprotcin und ein Kopplungsprotcin umfaBt, wobei bcidc Proteine wic oben definiert. sind. 

40 Der erfindungsgemaBe akzessorische in vitro-Komplex ist gewissermaBen als Vorstufe zu dem oben beschriebenen er- 
findungsgemaBen thermostabilen in vitro-Komplex zur Template-abhangigen Elongation von Nukieinsauren zu verste- 

hen. . 

Der akzessorische Komplex muB lediglich mit einem Elongationsprotein kombiniert werden, urn diese m erne deuthch 
erhohte Prozessivitat zu verteihen. Der akzessorische in vitro-Komplex kann daher auch zusammen nut bekannten ther- 
45 mostabilen Polymerasen eingesetzt werden, wobei ebenfalls Nachteile dieser bekannten Proteine hinsichtlich insbeson- 
dere der Prozessivitat verringert werden konnen. 

identifizierung der Gene, Klonierung der Gene, Expression dieser und Reinigung der Proteine der erfindungsgemaBen 
in vitro- Komplexe: 

In der Regel konnen die Komplexe, bestehend aus rekombinanten Proteinen, mit den folgenden Schritten bereitgestellt 
50 werden: Bcrcitstcllung des Nuklcinsaurcfragmcntcs welches fur das gewunschtc Protein kodicrt, Ligation in cincn Ex- 
pressionsvektor, Transformation in einen Wirt, Expression und Aufreinigung des Proteins. In t Jbereinstimmung mit der 
vorliegenden Erfindung kann es vorkommen, daB Gene, insbesondere aus den Archaebakterien, Inteine (Proc Natl Acad 
Sci USA 1992 Jun 15; 89(12): 5577-5581, Intervening sequences in an Archaea DNA polymerase gene, Perler FB, 
Gomb DG, Jack WE, Moran LS, Qiang B, Kucera RB, Benner J, Slatko BE, Nwankwo DO, Hempstead SK, et al) ent- 
55 hallen konnen, welche zunachst entfemt werden konnen. 

Die Identifizierung weiterer fur den erfindungsgemaBen Komplex geeigneten Proteine kann z. B. erfolgen durch Hc- 
mologiesuchen in Datenbanken, welche Genome aus Prokaryonten umfassen. Einige Programme sind hierfiir geeignet, 
beispielsweise das Programm BLASTP und FASTA (Altschui, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, 
Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST a new ge- 
60 ncration of protein database search programs", Nucleic Acids Res. 25: 3389-3402. W.R. Pearson & D J. Lipman PNAS 
(1988)85:2444^-2448). , 

Die Identifizierung kann auch dadurch geschehen, daB DNA Sonden verwendet werden, urn in z. B. gesamtgenom- 
ischen Banken aus Prokaryonten nach den entsprechenden Genen zu screenen. Die hierfur notigen experimentellen Ver- 
fahren finden sich in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, 

65 N.Y.(1989)). _ ( 

Die Bereitstellung der gereinigten Nukleinsaure der Gene der erfindungsgemaBen Komplexe kann z. B. uber deren 
Isolierung aus einer genomischen Bank des relevanten Organismus geschehen oder durch synthetische DNA-Herstel- 
lung, jeweiis gewiinschtenfalls kombiniert mit einer Amplifikation mittels PGR, unter Zuhilfenahme von Primern, wel- 
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che fiir den gewiinschten Genabschnitt spezifisch sind. Obliche Verfahren sind in Maniatis et al. (Molecular Cloning: A 
laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (1989)) beschrieben. 

Die Gene der Proteine der erfindungsgemaBen in vitro- Komplexe konnen in einer Vielzahl von Verfahren kloniert 
werden und somit mittels eines Hxpressionsvektors zur Proteinexpression in einem Wirtsorganismus zur Verfugung ge- 
stellt werden. Gangige Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor 5 
Laboratory Press, N.Y.(1989)) beschrieben. Die Gene der Komplexe konnen hierbei z. B. zunachst in einen 'high-copy* 
Vcktor, z. B. pUC18, pBst odcr pBR322 kloniert. werden und dann erst in cincn prokaryontischen Exprcssionsvcktor, 
z. B. pTrc99 umklonicrt werden, odcr abcr dirckt in cincn prokaryontischen Exprcssionsvcktor kloniert werden. Untcr 
Vektoren sind hierbei Nukleinsauren zu verstehen, die in der Lage sind, ein anderes Nukleinsauremolekiil in oder zwi- 
schen verschiedenen Organismen, bzw. genetischen Hintergriinden zu transportieren. Sie haben in der Regel die Fahig- 10 
keit der autonomen Replikation und/oder der Expression (Expressionsvektoren) des operativ verbundenen Nukleinsau- 
remolekuls. "Operativ verbunden" bedeutet, daB das transportierte Nukleinsauremolekul so mit dem \fektor verbunden 
ist, daB es unter der Transkriptions- und Translationskontrolle von Expressionskontrollsequenzen des Vektors steht und 
in einer Wirtszelle exprimiert werden kann. Bakterielle Expressionssysteme, die bevorzugte Verwendung derer, sowie 
eine Auswahl an Vektorsystemen ist z, B. in 'Gene Expression Technology', (Meth. EnzymoL, Vol 185, Goeddel, Ed., 15 
Academic Press, N.Y. (1990)) beschrieben. Geeignete Vektoren fiir die vorliegende Erfindung sollten unterschiedlich 
starke Expression der Proteine dadurch ermoglichen, daB sie einige oder alle der foigenden Eigenschaften besitzen: (1) 
Promotoren, oder Transkriptionsinitiationsstellen, entweder unmittelbar neben dem Start des Proteins oder als Fusions- 
protein, (2) Operatoren die verwendet werden konnen Genexpression an oder aus zu schalten, (3) ribosomale Bindungs- 
stellen fiir eine verbesserte Translation, und (4) Terminationsstellen fiir die Transkription oder Translation, die zu verbes- 20 
serter Stabilitat fiihren. 

Expressionsvektoren, die mit eukaryontischen Zellen, bevorzugterweise mit Vertebratenzellen kompatibel sind, kon- 
nen auch Verwendung finden. Einige bekannte Vektoren sind pS VL und pKSV-10 (Phannacia), pBPV-l/pML2d (Inter- 
national Biotechnologies, Inc.), und pTDTl (ATCC 31255). Die Verwendung eines retroviralen Expressions vektors ist 
auch moglich. 25 

Weitere Gegenstande der vorliegenden Erfindung sind daher DNA-Sequenzen, welche fur die erfindungsgemaBen 
thremostabilen in vitro-Komplexe bzw. akzessorischen in vitro- Komplexe codieren, sowie entsprechende Vektoren, vor- 
zugsweisc Expressionsvektoren. 

Die erfindungsgemaBen Vektoren cnthaltcn mindestens das Gen fiir das Glcitklammcrprotcin und vorzugsweisc min- 
destens ein Gen fiir ein Kopplungs- oder/und Elongationsprotein, wie sie jeweils oben definiert sind. 30 

Es ist dabei im Rahmen der Erfindung bevorzugt, wenn der Vektor neben den darin bereits enthaltenen DNA-Sequen- 
zen noch geeignete Restriktionsschnittstellen und ggf. Polylinker zur Insertion weiterer DNA-Sequenzen enthalt Beson- 
ders bevorzugt ist es, wenn die raumliche Anordnung von bereits enthaltener DNA-Sequenz und zusatzlicher Insertions- 
stelle nach Expression zur Ausbildung eines Fusionsproteins fiihrt. 

Ebenfalls bevorzugt ist es, wenn der erfmdungsgeinafie Vektor Promotor- oder/und Operatorbereiche enthalt, wobei es 35 
besonders bevorzugt ist, wenn derartige Promotor- oder/und Operatorbereiche induzierbar oder reprimierbar sind. Da- 
durch wird eine Steuerung der Expression in Wirtszellen erheblich vereinfacht und kann besonders eftizient gestaltet 
werden. 

Derartige Promotor/Opcratorbcrcichc konnen in cincm Exprcssionsvcktor auch mchrfach vorkommcn, so daB cine 
ggf. unabhangige Expression mehrerer DNA-Sequenzen unter Verwendung nur eines Expressionsvektors ermoglicht 40 
wird. 

Ein besonders bevorzugter Vektor enthalt im Rahmen der Erfindung DNA-Sequenzen codierende fur alle Bestandteile 
eines erfindungsgemaBen in vitro-Komplexes oder akzessorischen in vitro- Komplexes. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Wirtszelle, enthaltend einen oder inehrerc erfindungsge- 
maBe(n) Vektor(en), wobei in dieser Wirtszelle unter geeigneten Bedingungen die Expression zu Proteinen erfolgen 45 
kann. Geeignete Bedingungen schlieflen beispielsweise Anwesenheit eines Induktors oder eines Derepressors ein. 

Fiir die Transformation, Phageninfektion und Zellkultur existieren Standardprotokolle in Maniatis et al. (Molecular 
Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.). Aus der Vielzahl der vorhandenen E. coli 
Stamme, die zur Transformation geeignet sind, sind die bevorzugten JM101 (ATCC No. 33876), XL1 (Stratagene), RRI 
(ATCC No. 3 1343) und BL21 (Pharmacia). Proteinexpression kann z. B. auch gcschchcn untcr Zuhilfcnahmc des E. coli 50 
Stammes INVaF (Invitrogen). 

Die Transformanten werden gemaB den geeigneten Wachstumsbedingungen des Wirtsstammes kultiviert. So werden 
die meisten E. coli Stamme z.B. in LB Medium kultiviert, bei 30°C bis 42°C bis zur logarithmischen oder stationaren 
Wachstumsphase. Die Proteine konnen aus einer transformierten Kultur gereinigt werden, wobei dies entweder aus ei- 
nem Zellpellet, nach Zenlrifugalion, oder aber aus der Kulturlosung geschehen kann. Sofern die Proteine aus dem Zell- 55 
pellet gereinigt werden, werden die Zellen in einem geeigneten Puffer resuspendiert und mittels Sonifizierung, enzyma- 
tischer Behandlung oder Einfrieren und Auttauen aufgebrochen. Sofern die Reinigung aus der Kultursuspension ge- 
schieht, das heiBt alleine oder iiber ein Fusionsprotein, wird der Uberstand von den Zellen mittels bekannter Verfahren, 
wie Zentrifugation abgetrennt. 

Die Separation und Reinigung der Proteine der erfindungsgemaBen Komplexe entweder aus dem Uberstand der Kul- 60 
turibsung odcr aus dem Zcllcxtrakt kann durch bekannte Separations- odcr Rcinigungsvcrfahrcn gcschchcn. Dicsc Mc- 
thoden sind z. B. solche die Loslichkeiten betreffen, wie Salzfallungen, und l^sungsnuttelfallungen, Methoden die sich 
die unterschiedlichen Molekulargewichte zu Nutze machen, wie Dialyse, Ultrafiltration, Gelfiltration, und SDS-Poly- 
acrylamidgelelektrophorese, Methoden die sich die unterschiedlichen Ladungen zu Nutze machen, Ionenaustauschchro- 
matographie, Methoden die sich die unterschiedlichen Hydrophobizitaten zu Nulze machen, wie reverse-phase HPLC 65 
(High Performance Liquid Chromatography), Methoden die sich bestimnite Affinitaten zu Nutze machen, wie Affinitat- 
schromatographie, und Methoden die sich Unterschiede im Isoelektrischen Punkt zu Nutze machen, wie isoelektrische 
Fokussierung. Es ist auch vorstellbar, daB Zellextrakte, entweder aus dem Organismus, welcher das Gen des akzessori- 
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schen Komplexes tragu gemacht werden konnen, welcher die erfindungsgemaBe Aufgabe erfiillt, oder aus dem rekom- 
binanLen Wktsorganismus, z. B. E. coli. Mil diesen Extraktionen kbnnte man unter Umstanden andere Reinigungs- 
schritte umgehen. 

Die oben beschriebenen Verfahren konnen in einer Vielzahl von Kombinationen eingesetzt werden um die Proteine 
5 des in vitro- Komplexes bereitzustellen. 

Der erfindungsgemaBe thermostabile prokaryontische akzessorische in vitro Komplexes kann zur Elongation von Nu- 
kleinsauren vcrwcndct. werden, z. B. zur Polyrncrasc-Kcttcn-Rcaktion, DNA Scqucnzicrung, zur Markicrung von Nukle- 
insauren und andcrcn Rcaktioncn, die die Nukleinsaure in vitro Synthcsc bcinhaltcn. Auch moglich ist die Anwcndung in 
der reversen Transkription, wobei entweder der erfindungsgemafie Komplex selbst reverse Transkriptase Aktivitat be- 

10 sitzU oder aber zusatzlich ein geeignetes Enzym hinzugefUgt wird, das reverse Transkriptase Aktivitat besitzt. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein Verfahren zur Template-abhangigen Elongadon von 
Nukleinsauren, wobei die Nukleinsaure notigenfalls denaturiert, mit mindestens einem Primer unter Hybridisierungsbe- 
dingungen versehen wird, wobei der Primer komplementar zu einem flankierenden Bereich einer gewunschten Nuklein- 
sauresequenz des Templatestrangs ist und mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primerelon- 

15 gation erfolgt, wobei als Polymerase ein erfindungsgemafier thermostabiler in vitro-Komplex eingesetzt wird. 

Verfahren zur Template-abhangigen Elongation von Nukleinsauren, bei denen die Elongation ausgehend von einem 
Primer erfolgt, der an die Template-Nukleinsaure anhybridisiert wurde und ein freies 3-OH-Ende fur die Elongation zur 
Verfugung stellt, sind dem Fachmann bekannt. Zur Amplifikation wird insbesondere eine Polymerasekettenreakdon 
durchgefiihrt. Hierbei wird normalerweise von einer doppelstrangigen DNA-Sequenz ausgegangen, von welcher ein be- 

20 stimmter Zielbereich amplifiziert werden soli. Hierbei werden zwei Primer eingesetzt, welche zu die Zielsequenz flan- 
kierenden Bereichen auf jeweils einem Teilstrang des DNA-Doppelstranges komplementar sind. Zur Anhybridisierung 
der Primer werden allerdings die DNA-Doppelstrange zuerst denaturiert, insbesondere thermisch aufgeschmolzen. Nach 
Anhybridisierung der Primer erfolgt eine Elongation mittels der Polymerase, daraufhin wird nochmals denaiuriert und 
damit die neu gebildeten DNA-Strange von den Template-Strangen getrennt, woraufhin fur einen weiteren Elongations- 

25 zyklus neben den urspriinglichen Templatestrangen auch die im ersten Schritt gebildeten Nukleinsaurestrange ais Tem- 
plate zur Verrugung stehen, diese jeweils erneut mit Primern hybridisiert werden und eine emeute Elongation stattfindet. 
Diese Vorgehensweise wird zyklisch durchgefiihrt unter jeweils thermischer Denaturierung als Zwischenschritte. 

Zur crfindungsgcmaB bevorzugten Reversen Transkription von RNA in DNA wird cbcnfalls ein crfindungsgcmaBcr 
thermostabiler in vitro- Komplex eingesetzt, wobei dessen Elongationsprotcin cine Reverse Transkriptasc-Aktivitat auf- 

30 weist. Diese Reverse Transkriptase-Aktivitat kann die einzige Polymeraseaktivitat des Eiongadonsproteins sein, kann 
aber auch zusatzlich zu einer vorhandenen S'-S'-DNA-Polymeraseaktivitat vorliegen. 

Ein weiteres bevorzugtes erfindungsgemafies Verfahren betriffl die Sequenzierung von Nukleinsauren ausgehend von 
einem Primer, der zu einem der zu sequenzierenden Nukleinsaure benachbarten Bereich komplementar ist, wobei wie- 
derum eine Template-abhangige Elongation oder aber bei Sequenzierung einer RNA eine Reverse Transkription unter 

35 Verwendung von Deoxynukleodden und Dideoxynukleodden gemaB der Methode von Sanger durchgefuhrt wird. Als 
Deoxynukleotide oder Dideoxynukleotide werden im Rahmen dieser bevorzugten Ausluhrungsform auch die oben be- 
schriebenen jeweiligen Derivate als geeignet angesehen. Insbesondere ist es fur die erfindungsgemaJ3en \ferfahren zur 
Elongation von Nukleinsauren bevorzugt, daB die gebildeten Nukleinsauren markiert werden. Hierzu ist es moglich, 
markicrtc Primer odcr/und markicrtc Deoxynukleotide odcr/und markicrtc Dideoxynukleotide odcr/und markicrre Riho- 

40 nukleotide oder jeweils entsprechende Derivate, wie sie oben bereits beispielsweise beschrieben sind, einzusetzen. 

Wiederum ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Markierung von Nukleinsauren 
durch Einfiigung einzelner Bruche in Phosphodiesterbindungen der Nukleinsaurekette und Ersatz eines Nukleotids an 
den Bruchstellen durch ein markiertes Nukleodd mit Hilfe einer Polymerase, wobei als Polymerase ein erfindungsgema- 
Ber Qiennostabiler in viLro-Komplex eingesetzt wird. 

45 Ein solches Verfahren, allgemein Mck-Translation genannt, ermoglicht eine einfache Markierung von Nukleinsauren, 
Alle oben bereits beschriebenen markierten Ribonukleotide oder Deoxyribonukleotide oder Derivate davon sind hierfur 
geeignet, solange die Polymerase sie als Substrat akzeptiert. 

Diese erfindungsgemaBe Markierung kann z. B. auch im Rahmen oder anschlieBend an eine PCR-Reaktion erfolgen, 
wofiir die erfindungsgemaBe Verwendung eines thermostabilen in vitro-Komplexes besonders giinstig ist. 

50 (}cgcnstand der vorliegenden Erfindung ist cbcnfalls ein Kit zur Elongadon odcr/und Amplifikation odcr/und Rever- 
sen Transkription oder/und Sequenzierung von Nukleinsauren, wobei dieser Kit in einem oder in mehreren Behaltem 
vorliegen kann, enthaltend 

a) einen erfindungsgemaBen thermostabilen in vitro Komplex oder 
. 55 b) einen thermostabilen, akzessorischen in vilro-Komplex und ggf . separal davon ein Polymeraseaktivitat aufwei- 

sendes Elongationsprotein sowie ggf. Primer, Puffersubstanzen, Nukleotide, ATP, andere Kofaktoren oder/und Py- 
rophosphat. 

Insbesondere ist Gegenstand der vorliegenden Erfindung ein Kit zur Elongation, Amplifikation, Reversen Iranskrip- 
60 tion, Markicrung bzw. Scqucnzicrung von Nukleinsauren, wobei zusatzlich Deoxynukleotide bzw. dcrcn Derivate ent- 
haltend sind. 

Ein bevorzugter erfindungsgemafier Reagenzienkit enthalt daher zur Amplifikation von Nukleinsauren neben den Sub- 
stanzen a) oder b), welche S'-S'-Polymeraseaktivitat aufweisen, auch Deoxynukleotide oder/und Derivate davon. Gege- 
benenfalls konnen hier auch Ribonukleotide oder Derivate davon eingesetzt werden, namlich dann, wenn eine Polyme- 
65 rase eingesetzt wird, welche auch Ribonukleotide als Substrat akzeptiert. 

Ein weiterer bevorzugter Gegenstand der vorliegenden Erfindung ist ein Kit zur Sequenzierung von Nukleinsauren, 
wobei zusatzlich zu Deoxynukleotiden bzw. deren Derivaten, Dideoxynukleotide bzw. deren Derivate zur Kettentermi- 
nation enthaltend sind 
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Desweiteren ist insbesondere Gegenstand der vorliegenden Erfindung ein Kit zur reversen TVanskrition von Nuklein- 
sauren wobei entweder der erfindungsgemaBe Komplex selbsl reverse Transkriptase Aktiviliil besitzl, oder aber zusatz- 
Uch ein geeignetes Enzym anwesend ist, das reverse Transkriptase Aktivitat besitzt, wobei Deoxynukleotide bzw. deren 
Derivaten im Reaktionsgemisch enthalten sind. 

In einer weiteren besonders bevorzugten AusfUhrungsform enthait der Kit Primer oder/und Deoxynukleotide oder/und 
Dideoxvnukleotide oder/und Ribonukleotide oder/und deren jeweilige Deri vate in markierter Form. 

Insbesondere fur die Scqucnzicrung von Nukicinsaurcn ist cs notig, cine Markicrung cinzufugen. Gccignctc Markic- 
rungen sind wcitcr oben bcrcits in bcispicihaftcr Form bcschricbcn und gcltcn cbenso als bevorzugtc Ausfuhrungsfor- 
men im Rahmen der erfindungsgemaBen Reagenzienkits. 

Im Rahmen der vorUegenden Erfindung ist es weiterhin moglich, daB der Reagenzienkit zur Markierung von NuWe- 
insauren im Rahmen einer sogenannten Nick-Translation eingesetzt wird. In diesem FaU enthait der Reagenzienkit die 
Bestandteile a) oder b) und markierte Nukleotide, wobei Puffersubstanzen, ATP oder andere Kofaktoren oder/und Pyro- 
phosphat ebenfalls anwesend sein konnen. Primer werden allerdings im Rahmen einer Nick-Translation in der Regel 
nicht benotigt. 

Gegenstand der vorhegenden Hrtindung ist desweiteren die Verwendung emes thermostabilen Gleitklarnmerproteins 
in vitro Verfahren zur Elongation, Amplification, Markierung bzw Sequenzierung oder Reversen Transkription von 



in 

N ^voraugt 5 ^st der Kit, wenn als Gleitklammerprotein ein thermostabiles Homolog zu dem PCNA-Protein (SEQ ID 
NO: 12, 13, 14, 15), dem PCNA-Homoiogen aus Archeaoglobus Fulgidus oder dem P-clamp-Protein (SEQ ID NO: 35, 
3 6) vorliegt. Insbesondere ist ein Kit bevorzugt, der zusiitzlich ein Kopplungsprotein enthait. 

Desweiteren ist ein Kit bevorzugt, der zusatzlich ein weiteres Protein enthaitend, wobei das weitere Protein als Klam- 
merlader zur Verfugung stent, auch aus der Gruppe der Prokaryonten stammt und thermostabil ist. 

Insbesondere ist ein Kit bevorzugt der einen geeigneten Puffer enthait, wie oben beschrieben. Bevorzugt ist ebenfalls, 
daB der erfindungsgemaBe Kit zusatzlich eine Pyrophosphatase, ATP oder/und andere Kofaktoren enthait 

Die folgenden Beispiele sollen in Verbindung mit den Abbildungen die Erfindung naher erlautern: 



Abbildungen 



10 



15 



20 



25 



Im folgcndcndcn werden haufig Scqucnznamcn verwendet, untcr denen die Protein- oder Nuklcinsaurcscqucnzcn in 
der Genbank und der EMBL Datenbank stehen. 

Abb.l 

Proteinsequenzen, paarweise Alignments und multiple Alignments aus Archaebakterien und den entsprechenden hu- 
manen Genen des Replikationsapparates. 

Wobei die Annotation: 1 bedeutet %Idenutat zu dem entsprechenden humanen Gen, berechnet aus dem paarweisen 
Alignment (siehe Anhang) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation 2 %Identitat zu dem f^ s P^ e " den 
Gen von Archaeoglobus Fulgidus, berechnet aus dem paarweisen Alignment (siehe Anhang) nut BLASTP 2.0.4 [Feb- 
24-1998] und die Annotation 3 %Tdcntitat zu dem entsprechenden humanen Gen, berechnet aus dem paarweisen 
Alignment mit FASTA 3.H02 [March, 1998] § bedeutet. Die Verfahren werden naher beschrieben in: 
Altschul, Stephen R, Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David 
j Unman (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs , Nucleic 
Acids Res 25* 3389-3402 und W.R. Pearson & D J. Lipman PNAS (1 988) 85: 2444-2448. Die Abbildung zeigt im Falle 
des Gleitklaimiierladers I, Gleilklaimnerlader II, Gleilklammer, koppelnde Untereinheit und ElongaUonsproiein I die Se- 
quenznamen aus den Datenbanken und ebenso deren SEQ ID Nummer, wobei die Werte in den Klammern jeweils Pro- 
zent Identitat je Anzahl Aminosauren darstellen. Im Falle des Hlongationsprotein U beziehen sich die Wferte auf Prozent 
Sequenzidendtat zu der Archaeaoglobus fulgidus Sequenz. 

Abb. 2 

Proteinsequenzen, paarweise Alignments und muldple Alignments aus Eubakterien des Replikationsapparates. Wobei 
die Annotation 1 bedeutet %Identitat zu dem entsprechenden Gen aus E. coli, berechnet aus dem paarweisen Ahgnment 
(siehe Anhang) mit BLASTP 2.0.4 [Feb-24-1998]*. Das Verfahren wird in: Altschul, Stephen F., Thomas L Madden 
Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997) Gapped BLAST and 
PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25: 3389-3402 naher besenne- 55 



ben. 

Abb. 3 



Abb. 4 
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50 



Skizzc des Replikationsapparates in einer moglichcn Variantc, wobei die Glcitkammcr iibcr cine koppelnde Untcrcin- 60 
hcit an das Elongation sprotcin bindct. 



Die Abb. 4 zeigt Alignments zweier konser vierter Regionen des Gleitklammerproleins, sowie die daraus hergeleiteten 65 
Konsensussequenzen. Folgende Gene sind gezeigt: PCNA human (aus SEQ ID NO: 11), die entsprechende Sequenz aus 
Archaeoglobus fulgidus (aus SEQ ID NO: 12), aus Methanococcus janashii (aus SEQ ID NO: 13), aus Pyrococcus non- 
koschii (aus SEQ ID NO: 14) und aus Methanococcus thermoautothrophicus (aus SEQ ID NO: 15). 
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Abb. 5 

Die Abb. 5 zeigt ein Alignment einer konservierten Regionen der koppelnden Untereinheit, sowie die daraus herge- 
leiteten Konsensussequenzen. Folgende Gene sind gezeigt: PruORF2, DPD2_HUMAN, AF1790 und MJ0702. Die SHQ 
5 ED Nummern konnen Abb. 1 entnommen werden. 

Abb. 6 

Die Abb. 6 zeigt ein Alignment einer konservierten Regionen der koppelnden Untereinheit, sowie die daraus herge- 
10 leiteten Konsensussequenzen. Folgende Gene sind gezeigt: ACH_HUMAN, AF2060, MTH0241, PHBN012 und 
MJ1422. Die SEQ ID Nummern konnen Abb. 1 entnommen werden. 

Abb. 7 

15 Die Abb. 7 zeigt ein Alignment einer konservierten Regionen des Gleitklammerlader 2, sowie die daraus hergeleiteten 
Konsensussequenzen. Folgende Gene sind gezeigt: AC15_IIUMAN, MJ0884, AF1195, MTII0240 und MTIIQ240. Die 
SEQ ID Nummern konnen Abb. 1 entnommen werden. 

Abb. 8 

20 ... 
Die Abb. 8 zeigt ein Alignment einer konservierten Regionen des Eionagationsproteins 1, sowie die daraus hergelei- 
teten Konsensussequenzen. Folgende Gene sind gezeigt: DPOD HUMAN, MJ0885, MTH1208, PHBT047 und 
DPOL_ARCFU. Die SEQ ID Nuimnern konnen Abb. 1 enuioiiunen werden. 

25 Abb. 9 

Die Abb. 9 zeigt ein Alignment einer konservierten Regionen des Elongationsproteins 2, sowie die daraus hergeleite- 
ten Konsensussequenzen. Folgende Gene sind gezeigt: AF1722, MJ1630, PfuORF3, MTH1536 und PHBN021. Die 
SEQ ID Nummern konnen Abb. 1 entnommen werden. 

30 

Abb. 10 

Die Abb. 10 zeigt ein Alignment einer konservierten Regionen des Elongationsproteins aus Eubakterien, sowie die 
daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DP3AJECOLI: DNA Pol IE, alpha subunit, 
35 Escherichia coli, BB0579: DNA Pol HE, alpha subunit, Borrelia burgdorferi, DP3A_HELPY: DNA Pol in, alpha subunit, 
Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SAL1T: DNA Pol III, alpha subunit, Salmonella 
typhimurium). 

Abb. II 

40 

Die Abb. 11 zeigt ein Alignment einer konservierten Regionen der Gleitklammer aus Eubakterien, sowie die daraus 
hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AAPOL3B, DP3B_ECOLI, S.TYPHIM, 
DP3B_PROMI, DP3B.PSEPU und DP3B_STRCO (AAPOL3B: Aqufex Aeolicus sektion 93: DP3B_ECOLI: DNA Pol 
III, beta chain, Escherichia coli S.TYPHIM: DNA Pol HI, beta chain, Salmonella typhimurium P3B_PROMI: DNA Pol 
45 m! beta chain, Probeus mirabilis DP3B_PSEPU: DNA Pol m, beta chain, Pseudomonas putida DP3B_STRCO: DNA 
Pol III, beta chain, Strptomyces coelicolor). 

Abb. 12 

50 Multiples Alignment der Glcitklammcr-protcinscqucnzcn zur Gcncricrung des Hidden Markov Models. 

Abb. 13 

Multiples Alignment der eubakteriellen Gleitklammerproteinsequenzen zur Generierung des Hidden Markov Models 
55 (AAPOL3B: Aqufex Aeolicus sektion 93: DP3B_ECOLI: DNA Pol IE, beta chain, Escherichia coli S.TYPHIM: DNA 
Pol m, beta chain, Salmonella typhimurium P3B_PROMI: DNA Pol HI, beta chain, Probeus mirabilis DP3B_PSEPU: 
DNA Pol HI, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol 111, beta chain, Strptomyces coelicolor). 

Abb. 14 

60 

Multiples Alignment der Gleitklammerlader 1 Protcinscqucnzcn zur (Jcncricrung des Hidden Markov Models. 

Abb. 15 

65 Multiples Alignment der Gleitklaimnerlader 2 Proteinsequenzen zur Generierung des Hidden Markov Models. 
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Abb. 16 

Multiples Alignment der Proteinsequenzen der koppelnden Untereinheiten zur Generierung des Hidden Markov Mo- 
dels. 

5 

Abb. 17 

Multiples Alignment der Sequenzen der Elongationsprotcinc 1 zur Generierung des Hidden Markov Models. 

Abb. 18 io 
Multiples Alignment der Sequenzen der Elongationsproteine 2 zur Generierung des Hidden Markov Models. 

Abb. 19 

15 

Multiples Alignment der Sequenzen der eubakteriellen Elongationsproteine zur Generierung des Hidden Markov Mo- 
dels. Folgende Gene sind gezeigt: 

DP3AJECOLI: DNA Pol m, alpha subunit, Escherichia coli, BB0579: DNA Pol m, alpha subunit, Borrelia burgdorferi, 
DP3A_HELPY: DNA Pol IE, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und 
DP3A_SALTY: DNA Pol IE, alpha subunit, Salmonella typhimurium). 20 

Beispiel 

Die DNA wird mittels der bekannten Verf ahren aus dem Organismus Archaeoglobus fulgidus (DSM No. 4304) gerei- 
nigt. Organismen Aufzucht geschieht hierbei durch die DSM (Deutsche Sammlung fur Mikroorganismen). Urn die ent- 25 
sprechenden Gene (Gleitklammeriader I/H, Gleitklammer, Elongationsproteine I/II, koppelnde Untereinheit) in den Ex- 
pressionsvektor pTrc99 zu klonieren, werden fiir jedes Gen Primer entwickelt, die den vollstandigen offenen Lesenrah- 
mcn umspanncn, sowic Start- wic Stopcodon. Hierbei werden den Primcrn jewcils Rcstriktionscndcn hinzugefugt, die 
die gcrichtctc Klonicrung in den Exprcssionsvcktor crlcichtcm. Untcr Vcrwcndung von ctwa 200 ng Gcsamtgcnom- 
ischer DNA werden mit den entsprechenden Annealing-Temperaturen PGR Reaktionen gefahren (etwa 35 Zyklen) und 30 
die daraus resultierenden Produkte gereinigt. Nach der Reinigung werden die Produkte mit Restriktionsenzymen behan- 
delt und uber ein Agarosegel gereinigt um zur Ligation bereit zu stehen. Der Expressionsvektor wird mittels Restrikti- 
onsenzymen so linearisiert, gereinigt und verdunnt, daB er zur Ligation mit den Amplifikaten der akzessorischen Gene 
aus der obigen PGR bereit ist. Die Ligation wird angesetzt und nach Inkubation ein Aliquot in den E. coli Stamm INValp- 
haF ? (Invtrogen) transforniiert. Von jedem Gen werden 3 positive Kolonien gepickt, Plasmid DNA prapariert und die In- 35 
serts auf Vbllstandigkeit und Richtigkeit mittels DNA Sequenzierung uberpriift. Korrekte Klone werden ausgesucht und 
erneut zur Vereinzelung auf Agarplatten (ampicillin) ausgebracht. Kolonien werden gepickt und Ubernachtkulturen an- 
gesetzt. Ein Aliquot (500 ul) der Ubernachtkultur wird in eine ein bis funf Liter Kultur von LB (Ampicillin: 80 mgA) ge- 
geben. Die Kulturcn wachscn bis zu cincr OD 660 von 0.8 bci 37°C nun wird zur Tnduktion TPTG zugegeben (125 mg/1). 
Diese Kulturen wachsen nun weitere 11 Stunden. Die Kulturen werden zentrifugiert und die Pellets in einem Puffer auf- 40 
genomrnen (Puffer A: 50 mM Tris-HGl pH 7.9, 50 mM Dextrose, 1 mM EDTA). Nach Zentrifugation werden die Zellen 
erneut aufgenommen, jedoch enthalt Puffer A nun zusatzlich Lysozym (4 mg/ml). Nach Inkubation (15 min.) wird ein 
gleiches Volumen Puffer B zugegeben (B: 10 mM Tris-HGl pH 7.9, 50 mM KC1, 1 mM EDTA, 1 mM PMSF, 0,5% 
Tween 20, 0.5% Nonidet P40) und die Lyse zur Inkubation bei 75°C fur eine Stunde gegeben. Nach Zentrifugation wird 
der tJberstand entnommen und die uberexprimierten Proteine werden mittels (NH4hS04 ausgefallt. Die Pellets werden 45 
nach Zentrifugation gesammelt und die Proteine mit Puffer A resuspendiert. Die resuspendierten Proteine werden gegen 
Aufbewahrungspuffer (50 mM Tris-HGl pH 7.9, 50 mM KG1, 0.1 mM EDTA, 1 mM D'lT, 0.5 mM PMSK 50% Glycerol) 
dialysiert und anschlieBend bei -70°G gelagert. 

Um die Aktivitat der Proteine zu testen werden Reaktionen wie folgt zusammengesetzt: Aliquote der Proteine werden 
in untcrschicdlichcn Konfigurationcn und Molaritatcn vcrcint, Glcitklammcrladcr I/n mit Gleitklammer, koppclndcr Un- 50 
tereinheit und Elongationsprotein I, oder (Ueitklammerlader I/n mit Gleitklammer, mit und ohne koppelnder Unterein- 
heit und Elongationsprotein II, oder Gleitklammer, und Elongationsprotein I oder H und schlieBlich nur Elongationspro- 
tein I oder II; als Puffer dient der obige Aufbewahrungspuffer. DNA Polymerisationsaktivitat wird mittels Inkorporation 
von (Methyl- 3 H) TTP in Trichlorsaure-unldsliches Material gemessen (Ishino, Y, Iwasaki, H., Fukui, H., Mineno, J., 
Kato, L, & Schinigawa, H. (1992) Biochimie 74, 131-136). Um die Prozessiviiat zu bestirmnen werden die obigen Pro- 55 
teingeinische in Primer-Elongationsexperimenten verwendet Ein M13 Einzelstrangtemplate wird in 10 mM THs-HCl 
(pH 9.4) eingebracht und gemeinsam mit einem Universal-primer (5'-FITC markiert) erhitzt (92°G) und abgekuhit 
(Raumtemperatur). Verdunnungsserien des so generierten Template-Primer Gemisches werden in einer Reaktion beste- 
hend aus Nukleotiden (etwa 200 uM bis 1 mM), Reaktionspuffer (Endkonzentration: 50 mM KQ, 10 mM Tris-IIGl (pll 
8.3), 1 .5-5 mM MgGl 2 , ATP (0 mM-200 mM) und protein stahilisicrcndcn Agcnzicn zusammcngefuhrt. und fur 1 0 Mi- 60 
nutcn bci 37°G, 52°, 62°, 68°, 74°, und 78° inkubicrt. Ein Aliquot wird zur Analyse auf cincn Scqucnzautomatcn gcladcn 
(z. B. Alf, Pharmacie Biotech). Die obigen Proteingemische dienen auch dazu Fidelity und Exonukleaseaktivitat zu mes- 
sen, wobei die in Kohler et al. (Proc. Natl. Acad. Sci. USA 88: 7958 7962 (1 991) oder Ghase et al. (J. Biol. Ghem., 249: 
4545-4552 (1972) beschriebenen Verfahren zur Anwendung kommen. Ebenso werden die Proteingemische in der PGR 
eingesetzl (Methods in Molecular Biology Vol. 15 Humana Press Tbtowa, New Jersey, 1993, edited by Bruce A. White). 65 
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SEQUENZPROTOKOLL 

(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: LION bioscience AG 

(B) STRASSE: Im Neuenheimer Feld 517 

(C) ORT: Heidelberg 

(E) LAND: DE 

(F) POSTLEITZAHL: 59120 

(ii) BEZEICHNUNG DER ERFINDUNG: Akzessorische Komplexe mit 

Polymeraseaktivitaet 

(iii) ANZAHL DER SEQUENZEN: 38 

(iv) COMPUTER-LESBARE FASSUIMG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 340 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

Met Glu Thr Ser Ala Leu Lys Gin Gin Glu Gin Pro Ala Ala Thr Lys 
15 10 15 

He Arg Asn Leu Pro Trp Val Glu Lys Tyr Arg Pro Gin Thr Leu Asn 
20 25 30 
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Asp Leu He Ser His Gin Asp He Leu Ser Thr He Gin Lys Phe He 
35 40 45 

Asn Glu Asp Arg Leu Pro His Leu Leu Leu Tyr Gly Pro Pro Gly Thr 
50 55 60 

Gly Lys Thr Ser Thr He Leu Ala Cys Ala Lys Gin Leu Tyr Lys Asp 
65 70 75 80 

Lys Glu Phe Gly Ser Met Val Leu Glu Leu Asn Ala Ser Asp Asp Arg 
85 90 95 

Gly lie Asp lie He Arg Gly Pro He Leu Ser Phe Ala Ser Thr Arg 
100 105 110 

Thr lie Phe Lys Lys Gly Phe Lys Leu Val lie Leu Asp Glu Ala Asp 
115 120 125 

Ala Met Thr Gin Asp Ala Gin Asn Ala Leu Arg Arg Val He Glu Lys 
1 30 1 35 1 40 

Phe Thr Glu Asn Thr Arg Phe Cys Leu He Cys Asn Tyr Leu Ser Lys 
145 150 155 160 

He lie Pro Ala Leu Gin Ser Arg Cys Thr Arg Phe Arg Phe Gly Pro 
165 170 175 

Leu Thr Pro Glu Leu Met Val Pro Arg Leu Glu His Val Val Glu Glu 
180 185 190 

Glu Lys Val Asp He Ser Glu Asp Gly Met Lys Ala Leu Val Thr Leu 
195 200 205 

Ser Ser Gly Asp Met Arg Arg Ala Leu Asn He Leu Gin Ser Thr Asn 
210 215 220 

Met Ala Phe Gly Lys Val Thr Glu Glu Thr Val Tyr Thr Cys Thr Gly 
225 230 235 240 

His Pro Leu Lys Ser Asp He Ala Asn lie Leu Asp Trp Met Leu Asn 
245 250 255 

Gin Asp Phe Thr Thr Ala Tyr Arg Asn lie Thr Glu Leu Lys Thr Leu 
260 265 270 

Lys Gly Leu Ala Leu His Asp He Leu Thr Glu He His Leu Phe Val 
275 280 285 
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His Arg Val Asp Phe Pro Ser Ser Val Arg He His Leu Leu Thr Lys 
290 295 300 

Met Ala Asp lie Glu Tyr Arg Leu Ser Val Gly Thr Asn Glu Lys lie 
305 310 315 320 

Gin Leu.Ser Ser Leu lie Ala Ala Phe Gin Val Thr Arg Asp Leu lie 
325 330 335 

Val Ala Glu Ala 
340 

(2) ANGABEN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Glu Asn Phe Glu lie Trp Val Glu Lys Tyr Arg Pro Arg Thr Leu 
15 10 15 

Asp Glu Val Val Gly Gin Asp Glu Val lie Gin Arg Leu Lys Gly Tyr 
20 25 30 

Val Glu Arg Lys Asn lie Pro His Leu Leu Phe Ser Gly Pro Pro Gly 
35 40 45 

Thr Gly Lys Thr Ala Thr Ala lie Ala Leu Ala Arg Asp Leu Phe Gly 
50 55 60 

Glu Asn Trp Arg Asp Asn Phe lie Glu Met Asn Ala Ser Asp Glu Arg 
65 70 75 80 

Gly lie Asp Val Val Arg His Lys He Lys Glu Phe Ala Arg Thr Ala 
85 90 95 
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Pro lie Gly Gly Ala Pro Phe Lys lie lie Phe Leu Asp Glu Ala Asp 
100 105 110 

Ala Leu Thr Ala Asp Ala Gin Ala Ala Leu Arg Arg Thr Met Glu Met 
115 1 20 1 25 

Tyr Ser Lys Ser Cys Arg Phe He Leu Ser Cys Asn Tyr Val Ser Arg 
130 135 140 

lie He Glu Pro He Gin Ser Arg Cys Ala Val Phe Arg Phe Lys Pro 
145 150 155 160 

Val Pro Lys Glu Ala Met Lys Lys Arg Leu Leu Glu He Cys Glu Lys 
165 170 175 

Glu Gly Val Lys He Thr Glu Asp Gly Leu Glu Ala Leu lie Tyr He 
1 80 185 1 90 

Ser Gly Gly Asp Phe Arg Lys Ala He Asn Ala Leu Gin Gly Ala Ala 
195 200 205 

Ala He Gly Glu Val Val Asp Ala Asp Thr He Tyr Gin He Thr Ala 
210 215 220 

Thr Ala Arg Pro Glu Glu Met Thr Glu Leu lie Gin Thr Ala Leu Lys 
225 230 235 240 

Gly Asn Phe Met Glu Ala Arg Glu Leu Leu Asp Arg Leu Met Val Glu 
245 250 255 

Tyr Gly Met Ser Gly Glu Asp lie Val Ala Gin Leu Phe Arg Glu lie 
260 265 270 

He Ser Met Pro lie Lys Asp Ser Leu Lys Val Gin Leu lie Asp Lys 
275 280 285 

Leu Gly Glu Val Asp Phe Arg Leu Thr Glu Gly Ala Asn Glu Arg lie 
290 295 " 300 

Gin Leu Asp Ala Tyr Leu Ala Tyr Leu Ser Thr Leu Ala Lys Lys 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 3: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1847 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
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(D) TOPOLOGIE: linear 

5 (ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 

10 



is (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

Met Val lie He Met Glu Lys Pro Trp Val Glu Lys Tyr Arg Pro Lys 
1 5 10 15 

20 

Thr Leu Asp Asp lie Val Gly Gin Asp Glu He Val Lys Arg Leu Lys 
20 25 30 

as Lys Tyr Val Glu Lys Lys Ser Met Pro His Leu Leu Phe Ser Gly Pro 
35 40 .45 

Pro Gly Val Gly Lys Cys Leu Thr Gly Asp Thr Lys Val He Val Asn 
» 50 55 60 

Gly Glu He Arg Glu He Gly Glu Val He Glu Glu lie Ser Asn Gly 
65 70 75 80 

35 

Lys Phe Gly Val Thr Leu Thr Asn Asn Leu Lys Val Leu Gly He Asp 
85 90 95 

40 Glu Asp Gly Lys lie Arg Glu Phe Asp Val Gin Tyr Val Tyr Lys Asp 
100 105 110 

45 Lys Thr Asn Thr Leu lie Lys He Lys Thr Lys Met Gly Arg Glu Leu 
115 120 125 

Lys Val Thr Thr Tyr His Pro Leu Leu lie Asn His Lys Asn Gly Glu 
so 130 135 140 

He Lys Trp Glu Lys Ala Glu Asn Leu Lys Val Gly Asp Lys Leu Ala 
145 150 155 160 

55 

Thr Pro Arg Tyr He Leu Phe Asn Glu Ser Asp Tyr Asn Glu Glu Leu 
165 170 175 

60 Ala Glu Trp Leu Gly Tyr Phe He Gly Asp Gly His Ala Asp Lys Glu 
180 185 190 



65 
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Ser Asn Lys lie Thr Phe Thr Asn Gly Asp Glu Lys Leu Arg Lys Arg 
195 200 205 

Phe Ala Glu Leu Thr Glu Lys Leu Phe Lys Asp Ala Lys He Lys Glu 
210 215 220 

Arg lie His Lys Asp Arg Thr Pro Asp He Tyr Val Asn Ser Lys Glu 
225 230 235 240 

Ala Val Glu Phe He Asp Lys Leu Gly Leu Arg Gly Lys Lys Ala Asp 
245 250 255 

Lys Val Arg lie Pro Lys Glu lie Met Arg Ser Asp Ala Leu Arg Ala 
260 265 270 

Phe Leu Arg Ala Tyr Phe Asp Cys Asp Gly Gly He Glu Lys His Ser 
275 " 280 285 

He Val Leu Ser Thr Ala Ser Lys Glu Met Ala Glu Asp Leu Val Tyr 
290 295 300 

Ala Leu Leu Arg Phe Gly He lie Ala Lys Leu Arg Glu Lys Val Asn 
305 310 315 320 

Lys Asn Asn Asn Lys Val Tyr Tyr His He Val lie Ser Asn Ser Ser 
325 330 335 

Asn Leu Arg Thr Phe Leu Asp Asn He Gly Phe Ser Gin Glu Arg Lys 
340 345 350 

Leu Lys Lys Leu Leu Glu He lie Lys Asp Glu Asn Pro Asn Leu Asp 
355 360 365 

Val He Thr He Asp Lys Glu Lys He Arg Tyr He Arg Asp Arg Leu 
370 375 380 

Lys Val Lys Leu Thr Arg Asp He Glu Lys Asp Asn Trp Ser Tyr Asn 
385 390 ~ 395 400 

Lys Cys Arg Lys lie Thr Gin Glu Leu Leu Lys Glu He Tyr Tyr Arg 
405 410 415 

Leu Glu Glu Leu Lys Glu He Glu Lys Ala Leu Glu Glu Asn He Leu 
420 425 430 

He Asp Trp Asp Glu Val Ala Glu Arg Arg Lys Glu lie Ala Glu Lys 
435 440 445 
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Thr Gly lie Arg Ser Asp Arg lie Leu Glu Tyr lie Arg Gly Lys Arg 
450 455 460 

5 Lys Pro Ser Leu Lys Asn Tyr He Lys lie Ala Asn Thr Leu Gly Lys 
465 470 475 480 

10 Asn He Glu Lys He lie Asp Ala Met Arg He Phe Ala Lys Lys Tyr 
485 490 495 

Ser Ser Tyr Ala Glu He Gly Lys Met Leu Asn Met Trp Asn Ser Ser 
15 500 505 510 

He Lys lie Tyr Leu Glu Ser Asn Thr Gin Glu He Glu Lys Leu Glu 
515 520 525 

20 

Glu lie Arg Lys Thr Glu Leu Lys Leu Val Lys Glu lie Leu Asn Asp 
530 ~ 535 540 

25 Glu Lys Leu He Asp Ser He Gly Tyr Val Leu Phe Leu Ala Ser Asn 
545 550 555 560 

Glu lie Tyr Trp Asp Glu lie Val Glu He Glu Gin Leu Asn Gly Glu 
30 565 570 575 

Phe Thr He Tyr Asp Leu His Val Pro Arg Tyr His Asn Phe He Gly 
35 580 585 590 

Gly Asn Leu Pro Thr He Leu His Asn Thr Thr Ala Ala Leu Cys Leu 
595 600 605 

40 

Ala Arg Asp Leu Phe Gly Glu Asn Trp Arg Asp Asn Phe Leu Glu Leu 
610 615 620 

45 Asn Ala Ser Val Ser Lys Asp Thr Pro lie Leu Val Lys He Asp Gly 
625 630 635 640 

Lys Val Lys Arg Thr Thr Phe Glu Glu Leu Asp Lys He Tyr Phe Glu 
so 645 650 655 

Thr Asn Asp Glu Asn Glu Met Tyr Lys Lys Val Asp Asn Leu Glu Val 
660 .665 670 

55 

Leu Thr Val Asp Glu Asn Phe Arg Val Arg Trp Arg Lys Val Ser Thr 
675 680 685 

60 

He He Arg His Lys Val Asp Lys He Leu Arg He Lys Phe Glu Gly 
690 695 700 
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Gly Tyr He Glu Leu Thr Gly Asn His Ser lie Met Met Leu Asp Glu 
705 710 715 720 

Asn Gly Leu Val Ala Lys Lys Ala Ser Asp lie Lys Val Gly Asp Cys 
725 730 735 

Phe Leu Ser Phe Val Ala Asn lie Glu Gly Glu Lys Asp Arg Leu Asp 
740 745 750 

Leu Lys Glu Phe Glu Pro Lys Asp lie Thr Ser Arg Val Lys lie He 
755 760 765 

Asn Asp Phe Asp He Asp Glu Asp Thr Ala Trp Met Leu Gly Leu Tyr 
770 775 780 

Val Ala Glu Gly Ala Val Gly Phe Lys Gly Lys Thr Ser Gly Gin Val 
785 790 795 800 

He Tyr Thr Leu Gly Ser His Glu His Asp Leu He Asn Lys Leu Asn 
805 810 815 

Asp lie Val Asp Lys Lys Gly Phe Ser Lys Tyr Glu Asn Phe Thr Gly 
820 825 830 

Ser Gly Phe Asp Arg Lys Arg Leu Ser Ala Lys Gin lie Arg He Leu 
835 • , 840 845 

Asn Thr Gin Leu Ala Arg Phe Val Glu Glu Asn Phe Tyr Asp Gly Asn 
850 855 860 

Gly Arg Arg Ala Arg Asn Lys Arg lie Pro Asp He He Phe Glu Leu 
865 870 875 880 

Lys Glu Asn Leu Arg Val Glu Phe Leu Lys Gly Leu Ala Asp Gly Asp 
885 890 895 

Ser Ser Gly Asn Trp Arg Glu Val Val Arg He Ser Ser Lys Ser Asp 
900 905 910 

Asn Leu Leu He Asp Thr Val Trp Leu Ala Arg He Ser Gly He Glu 
915 920 925 

Ser Ser He Phe Glu Asn Glu Ala Arg Leu He Trp Lys Gly Gly Met 
930 935 940 

Lys Trp Lys Lys Ser Asn Leu Leu Pro Ala Glu Pro He lie Lys Met 
945 950 955 960 
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lie Lys Lys Leu Glu Asn Lys lie Asn Gly Asn Trp Arg Tyr lie Leu 
965 970 975 

s Arg His Gin Leu Tyr Glu Gly Lys Lys Arg Val Ser Lys Asp Lys lie 
980 985 990 

Lys Gin He Leu Glu Met Val Asn Val Glu Lys Leu Ser Asp Lys Glu 
10 995 1000 1005 

Lys Glu Val Tyr Asp Leu Leu Lys Lys Leu Ser Lys Thr Glu Leu Tyr 
is 1010 1015 1020 

Ala Leu Val Val Lys Glu lie Glu He lie Asp Tyr Asn Asp Phe Val 
1025 1030 1035 1040 

20 

Tyr Asp Val Ser Val Pro Asn Asn Glu Met Phe Phe Ala Gly Asn Val 
1045 1050 1055 

25 Pro lie Leu Leu His Asn Ser Asp Glu Arg Gly lie Asp Val lie Arg 
1060 1065 1070 

Thr Lys Val Lys Asp Phe Ala Arg Thr Lys Pro He Gly Asp Val Pro 
30 1075 1080 1085 

Phe Lys He He Phe Leu Asp Glu Ser Asp Ala Leu Thr Ala Asp Ala 
35 1090 1095 1100 

Gin Asn Ala Leu Arg Arg Thr Met Glu Lys Tyr Ser Asp Val Cys Arg 
1105 1110 1115 1120 

40 

Phe lie Leu Ser Cys Leu Thr Gly Asp Ala Lys lie Thr Leu Pro Asp 
1125 1130 1135 

4s Glu Arg Glu He Lys He Glu Asp Phe He Lys Met Phe Glu Glu Arg 
1140 1145 1150 

Lys Leu Lys His Val Leu Asn Arg Asn Gly Glu Asp Leu Val Leu Ala 
so 1155 1160 1165 

Gly Val Lys Phe Asn Ser Lys lie Val Asn His Lys Val Tyr Arg Leu 
1170 1175 1180 

55 

Val Leu Glu Ser Gly Arg Glu He Glu Ala Thr Gly Asp His Lys Phe 
1185 1190 1195 1200 

60 Leu Thr Arg Asp Gly Trp Lys Glu Val Tyr Glu Leu Lys Glu Asp Asp 
1205 1210 1215 
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Glu Val Leu Val Tyr Pro Ala Leu Glu Gly Val Gly Phe Glu Val Asp 
1220 1225 1230 

Glu Arg Arg lie lie Gly Leu Asn Glu Phe Tyr Glu Phe Leu Thr Asn 
1235 1240 1245 

Tyr Glu lie Lys Leu Gly Tyr Lys Pro Leu Gly Lys Ala Lys Ser Tyr ,„ 
1250 1255 1260 

Lys Glu Leu lie Thr Arg Asp Lys Glu Lys He Leu Ser Arg Val Leu 

1265 1270 1275 1280 is 

Glu Leu Ser Asp Lys Tyr Ser Lys Ser Glu He Arg Arg Lys lie Glu 
1285 1290 1295 

20 

Glu Glu Phe Gly He Lys lie Ser Leu Thr Thr lie Lys Asn Leu lie 
1300 1305 1310 

Asn Gly Lys He Asp Gly Phe Ala Leu Lys Tyr Val Arg Lys lie Lys 25 
1315 1320 1325 

Glu Leu Gly Trp Asp Glu He Thr Tyr Asp Asp Glu Lys Ala Gly He 3(J 
1330 1335 1340 

Phe Ala Arg Leu Leu Gly Phe lie He Gly Asp Gly His Leu Ser Lys 

1345 1350 1355 1360 35 

Ser Lys Glu Gly Arg He Leu He Thr Ala Thr He Asn Glu Leu Glu 
1365 1370 1375 

40 

Gly He Lys Lys Asp Leu Glu Lys Leu Gly He Lys Ala Ser Asn He 
1380 1385 1390 

lie Glu Lys Asp lie Glu His Lys Leu Asp Gly Arg Glu lie Lys Gly 45 
1395 1400 1405 

Lys Thr Ser Phe He Tyr He Asn Asn Lys Ala Phe Tyr Leu Leu Leu 

1410 1415 1420 50 

Asn Phe Trp Gly Val Glu He Gly Asn Lys Thr He Asn Gly Tyr Asn 

1425 1430 1435 1440 js 

lie Pro Lys Trp lie Lys Tyr Gly Asn Lys Phe Val Lys Arg Glu Phe 
1445 1450 1455 

60 

Leu Arg Gly Leu Phe Gly Ala Asp Gly Thr Lys Pro Tyr He Lys Lys 
1460 1465 1470 



65 
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Tyr Asn lie Asn Gly He Lys Leu Gly He Arg Val Glu Asn lie Ser 
1475 1480 1485 

S Lys Asp Lys Thr Leu Glu Phe Phe Glu Glu Val Lys Lys Met Leu Glu 
1490 1495 1500 

Glu Phe Glu Val Glu Ser Tyr lie Lys Val Ser Lys He Asp Asn Lys 
10 1505 1510 1515 1520 

Asn Leu Thr Glu Leu He Val Lys Ala Asn Asn Lys Asn Tyr Leu Lys 
, 5 1525 1530 1535 

Tyr Leu Ser Arg He Ser Tyr Ala Tyr Glu Lys Asp Asn Phe Ala Arg 
1540 1545 1550 

20 

Leu Val Gly Glu Tyr Leu Arg lie Lys Glu Ala Tyr Lys Asp lie lie 
1555 1560 1565 

25 Leu Lys Glu lie Ala Glu Asn Ala Leu Lys Glu Ala Asp Gly Glu Lys 
1570 1575 1580 

Ser Leu Arg Glu Leu Ala Arg Lys Tyr Asn Val Pro Val Asp Phe He 
30 1585 1590 1595 1600 

He Asn Gin Leu Lys Gly Lys Asp He Gly Leu Pro Arg Asn Phe Met 
3J 1605 1610 1615 

Thr Phe Glu Glu Phe Leu Lys Glu Lys Val Val Asp Gly Lys Tyr Val 
1 620 1 625 1 630 

40 

Ser Glu Arg He He Lys Lys Glu Cys lie Gly Tyr Arg Asp Val Tyr 
1 635 1 640 1 645 

45 Asp lie Thr Cys His Lys Asp Pro Ser Phe He Ala Asn Gly Phe Val 
1650 1655 1660 

Ser His Asn Cys Asn Tyr Pro Ser Lys He lie Pro Pro He Gin Ser 
so 1665 1670 1675 1680 

Arg Cys Ala Val Phe Arg Phe Ser Pro Leu Lys Lys Glu Asp He Ala 
1685 1690 1695 

55 

Lys Lys Leu Lys Glu lie Ala Glu Lys Glu Gly Leu Asn Leu Thr Glu 
1700 1705 1710 

60 Ser Gly Leu Glu Ala lie He Tyr Val Ser Glu Gly Asp Met Arg Lys 
1715 1720 1725 
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Ala lie Asn Val Leu Gin Thr Ala Ala Ala Leu Ser Asp Val lie Asp 
1730 1735 1740 

Asp Glu lie Val Tyr Lys Val Ser Ser Arg Ala Arg Pro Glu Glu Val 
1745 1750 1755 1760 

Lys Lys Met Met Glu Leu Ala Leu Asp Gly Lys Phe Met Glu Ala Arg 
1765 1770 1775 

Asp Leu Leu Tyr Lys Leu Met Val Glu Trp Gly Met Ser Gly Glu Asp 
1780 1785 1790 

lie Leu Asn Gin Met Phe Arg Glu lie Asn Ser Leu Asp lie Asp Glu 
1795 1800 1805 

Arg Lys Lys Val Glu Leu Ala Asp Ala He Gly Glu Thr Asp Phe Arg 
1810 1815 1820 

He Val Glu Gly Ala Asn Glu Arg lie Gin Leu Ser Ala Leu Leu Ala 
1825 1830 1835 1840 

Lys Met Ala Leu Met Gly Arg 
1845 

(2) ANGABEN ZU SEQ ID NO: 4: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 855 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met His Asn Met Glu Glu Val Arg Glu Val Lys Val Leu Glu Lys Pro 
1 5 10 15 

Trp Val Glu Lys Tyr Arg Pro Gin Arg Leu Asp Glu He Val Gly Gin 
20 25 30 
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Glu His lie Val Lys Arg Leu Lys His Tyr Val Lys Thr Gly Ser Met 
35 40 45 

5 Pro His Leu Leu Phe Ala Gly Pro Pro Gly Val Gly Lys Cys Leu Thr 
50 55 60 

10 Gly Asp Thr Lys Val He Ala Asn Gly Gin Leu Phe Glu Leu Arg Glu 
65 70 75 80 

Leu Val Glu Lys lie Ser Gly Gly Lys Phe Gly Pro Thr Pro Val Lys 
1S 85 90 95 

Gly Leu Lys Val lie Gly lie Asp Glu Asp Gly Lys Leu Arg Glu Phe 
100 105 110 

20 

Glu Val Gin Tyr Val Tyr Lys Asp Lys Thr Glu Arg Leu lie Arg He 
115 120 125 

25 Arg Thr Arg Leu Gly Arg Glu Leu Lys Val Thr Pro Tyr His Pro Leu 
130 135 140 

Leu Val Asn Arg Arg Asn Gly Glu He Lys Trp Val Lys Ala Glu Glu 
30 145 150 155 160 

Leu Lys Pro Gly Asp Lys Leu Ala Val Pro Arg Phe Leu Pro lie Val 
35 165 170 175 

Thr Gly Glu Asp Pro Leu Ala Glu Trp Leu Gly Tyr Phe Leu Gly Gly 
180 185 190 

40 

Gly Tyr Ala Asp Ser Lys Glu Asn Leu He Met Phe Thr Asn Glu Asp 
195 200 205 

45 Pro Leu Leu Arg Gin Arg Phe Met Glu Leu Thr Glu Lys Leu Phe Ser 
210 ' 215 220 

Asp Ala Arg lie Arg Glu lie Thr His Glu Asn Gly Thr Ser Lys Val 
so 225 230 235 240 

Tyr Val Asn Ser Lys Lys Ala Leu Lys Leu Val Asn Ser Leu Gly Asn 
245 250 255 

55 

Ala His He Pro Lys Glu Cys Trp Arg Gly He Arg Ser Phe Leu Arg 
260 265 270 

60 Ala Tyr Phe Asp Cys Asn Gly Gly Val Lys Gly Asn Ala He Val Leu 
275 280 285 
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Ala Thr Ala Ser Lys Glu Met Ser Gin Glu He Ala Tyr Ala Leu Ala 
290 295 300 

Gly Phe Gly lie lie Ser Arg lie Gin Glu Tyr Arg Val lie lie Ser 
305 310 315 320 

Gly Ser Asp Asn Val Lys Lys Phe Leu Asn Glu lie Gly Phe lie Asn 
325 330 335 

Arg Asn Lys Leu Glu Lys Ala Leu Lys Leu Val Lys Lys Asp Asp Pro 
340 345 350 

Gly His Asp Gly Leu Glu He Asn Tyr Glu Leu lie Ser Tyr Val Lys 
355 360 365 

Asp Arg Leu Arg Leu Ser Phe Phe Asn Asp Lys Arg Ser Trp Ser Tyr 
370 375 380 

Arg Glu Ala Lys Glu He Ser Trp Glu Leu Met Lys Glu lie Tyr Tyr 
385 390 395 400 

Arg Leu Asp Glu Leu Glu Lys Leu Lys Glu Ser Leu Ser Arg Gly lie 
405 410 415 

Leu lie Asp Trp Asn Glu Val Ala Lys Arg lie Glu Glu Val Ala Glu 
420 425 430 

Glu Thr Gly He Arg Ala Asp Glu Leu Leu Glu Tyr lie Glu Gly Lys 
435 440 445 

Arg Lys Leu Ser Phe Lys Asp Tyr He Lys lie Ala Lys Val Leu Gly 
450 455 460 

lie Asp Val Glu His Thr lie Glu Ala Met Arg Val Phe Ala Arg Lys 
465 470 475 480 

Tyr Ser Ser Tyr Ala Glu lie Gly Arg Arg Leu Gly Thr Trp Asn Ser 
485 490 495 

Ser Val Lys Thr He Leu Glu Ser Asn Ala Val Asn Val Glu lie Leu 
500 505 510 

Glu Arg He Arg Lys He Glu Leu Glu Leu lie Glu Glu He Leu Ser 
515 520 525 

Asp Glu Lys Leu Lys Glu Gly lie Ala Tyr Leu He Phe Leu Ser Gin 
530 535 540 
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Asn Glu Leu Tyr Trp Asp Glu lie Thr Lys Val Glu Glu Leu Arg Gly 
545 550 555 560 

5 Glu Phe He He Tyr Asp Leu His Val Pro Gly Tyr His Asn Phe He 
565 570 575 

10 Alg Gly Asn Met Pro Thr Val Val His Asn Thr Thr Ala Ala Leu Ala 
580 585 590 

Leu Ser Arg Glu Leu Phe Gly Glu Asn Trp Arg His Asn Phe Leu Glu 
,s 595 ~ 600 605 

Leu Asn Ala Ser Asp Glu Arg Gly He Asn Val lie Arg Glu Lys Val 
610 615 620 

20 

Lys Glu Phe Ala Arg Thr Lys Pro lie Gly Gly Ala Ser Phe Lys He 
625 630 635 640 

25 He Phe Leu Asp Glu Ala Asp Ala Leu Thr Gin Asp Ala Gin Gin Ala 
645 650 655 

Leu Arg Arg Thr Met Glu Met Phe Ser Ser Asn Val Arg Phe He Leu 
30 660 665 670 

Ser Cys Asn Tyr Ser Ser Lys lie lie Glu Pro He Gin Ser Arg Cys 
35 675 680 685 

Ala He Phe Arg Phe Arg Pro Leu Arg Asp Glu Asp He Ala Lys Arg 
690 695 700 

40 

Leu Arg Tyr He Ala Glu Asn Glu Gly Leu Glu Leu Thr Glu Glu Gly 
705 " 710 715 720 

45 Leu Gin Ala He Leu Tyr lie Ala Glu Gly Asp Met Arg Arg Ala lie 
725 730 735 

Asn lie Leu Gin Ala Ala Ala Ala Leu Asp Lys Lys He Thr Asp Glu 
» 740 745 750 

Asn Val Phe Met Val Ala Ser Arg Ala Arg Pro Glu Asp He Arg Glu 
755 760 765 

55 

Met Met Leu Leu Ala Leu Lys Gly Asn Phe Leu Lys Ala Arg Glu Lys 
770 775 780 . 

60 

Leu Arg Glu He Leu Leu Lys Gin Gly Leu Ser Gly Glu Asp Val Leu 
785 790 795 800 
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Lys Pro Val Gly Ala Pro Phe Arg He He Phe Leu Asp Glu Val Asp 
100 105 110 

5 Asn Met Thr Lys Asp Ala Gin His Ala Leu Arg Arg Glu Met Glu Met 
115 120 125 

10 Tyr Thr Lys Thr Ser Ser Phe lie Leu Ser Cys Asn Tyr Ser Ser Lys 
130 135 140 

lie He Asp Pro lie Gin Ser Arg Cys Ala He Phe Arg Phe Leu Pro 
, s 145 150 155 160 

Leu Lys Gly His Gin He lie Lys Arg Leu Glu Tyr lie Ala Glu Lys 
165 170 175 

20 

Glu Asn Leu Glu Tyr Glu Ala His Ala Leu Glu Thr He Val Tyr Phe 
180 185 190 

25 Ala Glu Gly Asp Leu Arg Lys Ala He Asn Leu Leu Gin Ser Ala Ala 
1 95 200 205 

Ser Leu Gly Glu Lys He Thr Glu Ser Ser lie Tyr Asp Val Val Ser 
30 210 215 220 

Arg Ala Arg Pro Lys Asp Val Arg Lys Met He Lys Thr He Leu Asp 
3S 225 " 230 235 240 

Gly Lys Phe Met Glu Ala Arg Asp Met Leu Arg Glu lie Met Val Leu 
245 250 255 

40 

Gin Gly He Ser Gly Glu Asp Met Val Thr Gin He Tyr Gin Glu Leu 
260 265 270 

45 Ser Arg Leu Ala Met Glu Gly Glu Val Asp Gly Asp Arg Tyr Val Gly 
275 280 285 

Leu lie Asp Ala He Gly Glu Tyr Asp Phe Arg lie Arg Glu Gly Ala 
so 290 295 300 

Asn Pro Arg lie Gin Leu Glu Ala Leu Leu Ala Arg Phe Leu Glu His 
305 310 315 320 

55 - . 

Ala 
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(2) ANGABEN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1148 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) .ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Asp lie Arg Lys Phe Phe Gly Val lie Pro Ser Gly Lys Lys Leu 
1 5 10 15 

Val Ser Glu Thr Val Lys Lys Asn Glu Lys Thr Lys Ser Asp Glu Glu 
20 25 30 

Thr Leu Lys Ala Lys Lys Gly lie Lys Glu lie Lys Val Asn Ser Ser 
35 40 45 

Arg Lys Glu Asp Asp Phe Lys Gin Lys Gin Pro Ser Lys Lys Lys Arg 
50 55 60 

lie He Tyr Asp Ser Asp Ser Glu Ser Glu Glu Thr Leu Gin Val Lys 
65 70 75 80 

Asn Ala Lys Lys Pro Pro Glu Lys Leu Pro Val Ser Ser Lys Pro Gly 
85 90 95 

Lys He Ser Arg Gin Asp Pro Val Thr Tyr lie Ser Glu Thr Asp Glu 
100 105 110 

Glu Asp Asp Phe Met Cys Lys Lys Ala Ala Ser Lys Ser Lys Glu Asn 
115 120 125 

Gly Arg Ser Thr Asn Ser His Leu Gly Thr Ser Asn Met Lys Lys Asn 
130 135 140 

Glu Glu Asn Thr Lys Thr Lys Asn Lys Pro Leu Ser Pro He Lys Leu 
145 150 155 160 
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Thr Pro Thr Ser Val Leu Asp Tyr Phe Gly Thr Gly Ser Val Gin Arg 
165 170 175 

s Ser Asn Lys Lys Met Val Ala Ser Lys Arg Lys Glu Leu Ser Gin Asn 
180 185 190 

10 Thr Asp Glu Ser Gly Leu Asn Asp Glu Ala He Ala Lys Gin Leu Gin 
195 . 200 205 

Leu Asp Glu Asp Ala Glu Leu Glu Arg Gin Leu His Glu Asp Glu Glu 
is 210 215 220 

Phe Ala Arg Thr Leu Ala Met Leu Asp Glu Glu Pro Lys Thr Lys Lys 
225 230 235 240 

20 

Ala Arg Lys Asp Thr Glu Ala Gly Glu Thr Phe Ser Ser Val Gin Ala 
245 250 255 

25 Asn Leu Ser Lys Ala Glu Lys His Lys Tyr Pro His Lys Val Lys Thr 
260 265 270 

Ala Gin Val Ser Asp Glu Arg Lys Ser Tyr Ser Pro Arg Lys Gin Ser 

30 275 280 285 

Lys Tyr Glu Ser Ser Lys Glu Ser Gin Gin His Ser Lys Ser Ser Ala 
3S 290 295 300 

Asp Lys He Gly Glu Val Ser Ser Pro Lys Ala Ser Ser Lys Leu Ala 
305 310 315 320 

40 

lie Met Lys Arg Lys Lys Glu Ser Ser Tyr Lys Glu lie Glu Pro Val 
325 330 335 

45 Ala Ser Lys Arg Lys Glu Asn Ala He Lys Leu Lys Gly Glu Thr Lys 
340 345 350 

Thr Pro Lys Lys Thr Lys Ser Ser Pro Ala Lys Lys Glu Ser Val Ser 
50 355 360 365 

Pro Glu Asp Ser Glu Lys Lys Arg Thr Asn Tyr Gin Ala Tyr Arg Ser 
370 375 380 

55 

Tyr Leu Asn Arg Glu Gly Pro Lys Ala Leu Gly Ser Lys Glu lie Pro 
385 390 395 400 

60 Lys Gly Ala Glu Asn Cys Leu Glu Gly Leu He Phe Val lie Thr Gly 
405 410 415 
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Val Leu Glu Ser He Glu Arg Asp Glu Ala Lys Ser Leu He Glu Arg 
420 425 430 

Tyr Gly Gly Lys Val Thr Gly Asn Val Ser Lys Lys Thr Asn Tyr Leu 
435 440 445 

Val Met Gly Arg Asp Ser Gly Gin Ser Lys Ser Asp Lys Ala Ala Ala 
450 455 460 

Leu Gly Thr Lys He He Asp Glu Asp Gly Leu Leu Asn Leu He Arg 
465 470 475 480 

Thr Met Pro Gly Lys Lys Ser Lys Tyr Glu He Ala Val Glu Thr Glu 
485 490 495. 

Met Lys Lys Glu Ser Lys Leu Glu Arg Thr Pro Gin Lys Asn Val Gin 
500 505 510 

Gly Lys Arg Lys lie Ser Pro Ser Lys Lys Glu Ser Glu Ser Lys Lys 
515 520 525 

Ser Arg Pro Thr Ser Lys Arg Asp Ser Leu Ala Lys Thr lie Lys Lys 
530 535 540 

Glu Thr Asp Val Phe Trp Lys Ser Leu Asp Phe Lys Glu Gin Val Ala 
545 550 555 560 

Glu Glu Thr Ser Gly Asp Ser Lys Ala Arg Asn Leu Ala Asp Asp Ser 
565 570 575 

Ser Glu Asn Lys Val Glu Asn Leu Leu Trp Val Asp Lys Tyr Lys Pro 
580 585 590 

Thr Ser Leu Lys Thr He He Gly Gin Gin Gly Asp Gin Ser Cys A'a 
595 600 605 

Asn Lys Leu Leu Arg Trp Leu Arg Asn Trp Gin Lys Ser Ser Ser Glu 
610 615 620 

Asp Lys Lys His Ala Ala Lys Phe Gly Lys Phe Ser Gly Lys Asp Asp 
625 630 635 640 

Gly Ser Ser Phe Lys Ala Ala Leu Leu Ser Gly Pro Pro Gly Val Gly 
645 650 655 

Lys Thr Thr Thr Ala Ser Leu Val Cys Gin Glu Leu Gly Tyr Ser Tyr 
660 665 670 
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Val Glu Leu Asn Ala Ser Asp Thr Arg Ser Lys Ser Ser Leu Lys Ala 
675 680 685 

5 lie Val Ala Glu Ser Leu Asn Asn Thr Ser lie Lys Gly Phe Tyr Ser 
690 695 700 

10 Asn Gly Ala Ala Ser Ser Val Ser Thr Lys His Ala Leu lie Met Asp 
705 710 715 720 

Glu Val Asp Gly Met Ala Gly Asn Glu Asp Arg Gly Gly lie Gin Glu 
is 725 730 735 

Leu lie Gly Leu lie Lys His Thr Lys He Pro lie lie Cys Met Cys 
740 745 750 

20 

Asn Asp Arg Asn His Pro Lys lie Arg Ser Leu Val His Tyr Cys Phe 
755 760 765 

25 Asp Leu Arg Phe Gin Arg Pro Arg Val Glu Gin He Lys Gly Ala Met 
770 775 780 

Met Ser He Ala Phe Lys Glu Gly Leu Lys lie Pro Pro Pro Ala Met 
30 785 790 795 800 

Asn Glu lie He Leu Gly Ala Asn Gin Asp He Arg Gin Val Leu His 
35 . 805 810 815 

Asn Leu Ser Met Trp Cys Ala Arg Ser Lys Ala Leu Thr Tyr Asp Gin 
820 825 830 

40 

Ala Lys Ala Asp Ser His Arg Ala Lys Lys Asp He Lys Met Gly Pro 
835 840 845 

45 Phe Asp Val Ala Arg Lys Val Phe Ala Ala Gly Glu Glu Thr Ala His 
850 855 860 

Met Ser Leu Val Asp Lys Ser Asp Leu Phe Phe His Asp Tyr Ser He 
s° 865 870 875 880 

Ala Pro Leu Phe Val Gin Glu Asn Tyr lie His Val Lys Pro Val Ala 
885 890 895 

55 

Ala Gly Gly Asp Met Lys Lys His Leu Met Leu Leu Ser Arg Ala Ala 
900 905 910 

60 Asp Ser He Cys Asp Gly Asp Leu Val Asp Ser Gin lie Arg Ser Lys 
915 920 925 
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Gin Asn Trp Ser Leu Leu Pro Ala Gin Ala He Tyr Ala Ser Val Leu 
930 935 940 

Pro Gly Glu Leu Met Arg Gly Tyr Met Thr Gin Phe Pro Thr Phe Pro 
945 950 955 960 

Ser Trp Leu Gly Lys His Ser Ser Thr Gly Lys His Asp Arg He Val 
965 970 975 

Gin Asp Leu Ala Leu His Met Ser Leu Arg Thr Tyr Ser Ser Lys Arg 
980 985 990 

Thr Val Asn Met Asp Tyr Leu Ser Leu Leu Arg Asp Ala Leu Val Gin 
995 1000 1005 

Pro Leu Thr Ser Gin Gly Val Asp Gly Val Gin Asp Val Val Ala Leu 
1010 1015 1020 

Met Asp Thr Tyr Tyr Leu Met Lys Glu Asp Phe Glu Asn lie Met Glu 
1025 1030 1035 1040 

He Ser Ser Trp Gly Gly Lys Pro Ser Pro Phe Ser Lys Leu Asp Pro 
1045 1050 1055 

Lys Val Lys Ala Ala Phe Thr Arg Ala Tyr Asn Lys Glu Ala His Leu 
1060 1065 1070 

Thr Pro Tyr Ser Leu Gin Ala He Lys Ala Ser Arg His Ser Thr Ser 
1075 1080 1085 

Pro Ser Leu Asp Ser Glu Tyr Asn Glu Glu Leu Asn Glu Asp Asp Ser 
1090 1095 1100 

Gin Ser Asp Glu Lys Asp Gin Asp Ala He Glu Thr Asp Ala Met He 
1105 1110 1115 1120 

Lys Lys Lys Thr Lys Ser Ser Lys Pro Ser Lys Pro Glu Lys Asp Lys 
1125 1130 1135 

Glu Pro Arg Lys Gly Lys Gly Lys Ser Ser Lys Lys 
1140 1145 

(2) ANGABEN ZU SEQ ID NO: 7: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 479 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



10 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

is 

Met Leu Trp Val Glu Lys Tyr Arg Pro Lys Thr Leu Glu Glu Val Val 
1 5 10 15 

2° Ala Asp Lys Ser He lie Thr Arg Val lie Lys Trp Ala Lys Ser Trp 
20 25 30 

Lys Arg Gly Ser Lys Pro Leu Leu Leu Ala Gly Pro Pro Gly Val Gly 
25 35 40 45 

Lys Thr Ser Leu Ala Leu Ala Leu Ala Asn Thr Met Gly Trp Glu Ala 
50 55 60 

30 

Val Glu Leu Asn Ala Ser Asp Gin Arg Ser Trp Arg Val lie Glu Arg 
65 70 75 80 

35 

lie Val Gly Glu Gly Ala Phe Asn Glu Thr He Ser Asp Glu Gly Glu 
85 90 95 

40 Phe Leu Ser Ser Arg He Gly Lys Leu Lys Leu He He Leu Asp Glu 
100 105 110 

Val Asp Asn He His Lys Lys Glu Asp Val Gly Gly Glu Ala Ala Leu 
45 115 120 125 

He Arg Leu He Lys Arg Lys Pro Ala Gin Pro Leu lie Leu He Ala 
130 135 140 

50 

Asn Asp Pro Tyr Lys Leu Ser Pro Glu Leu Arg Asn Leu Cys Glu Met 
145 150 155 160 

55 lie Asn Phe Lys Arg Leu Thr Lys Gin Gin Val Ala Arg Val Leu Glu 
165 170 175 

Arg He Ala Leu Lys Glu Gly He Lys Val Asp Lys Ser Val Leu Leu 
180 185 190 
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Lys He Ala Glu Asn Ala Gly Gly Asp Leu Arg Ala Ala lie Asn Asp 
195 200 205 

Phe Gin Ala Leu Ala Glu Gly Lys Glu Glu Leu Lys Pro Glu Asp Val 
210 215 220 

Phe Leu Thr Lys Arg Thr Gin Glu Lys Asp lie Phe Arg Val Met Gin 
225 230 235 240 

Met lie Phe Lys Thr Lys Asn Pro Ala Val Tyr Asn Glu Ala Met Leu 
245 250 255 

Leu Asp Glu Ser Pro Glu Asp Val lie His Trp Val Asp Glu Asn Leu 
260 265 270 

Pro Leu Glu Tyr Ser Gly Val Glu Leu Val Asn Ala Tyr Glu Ala Leu 
275 280 285 

Ser Arg Ala Asp He Phe Leu Gly Arg Val Arg Arg Arg Gin Phe Tyr 
290 295 300 

Arg Leu Trp Lys Tyr Ala Ser Tyr Leu Met Thr Val Gly Val Gin Gin 
305 310 315 320 

Met Lys Glu Glu Pro Lys Lys Gly Phe Thr Arg Tyr Arg Arg Pro Ala 
325 330 335 

Val Trp Gin Met Leu Phe Gin Leu Arg Gin Lys Arg Glu Met Thr Arg 
340 345 350 

Lys lie Leu Glu Lys He Gly Lys Tyr Ser His Leu Ser Met Arg Lys 
355 360 365 

Ala Arg Thr Glu Met Phe Pro Val He Lys Leu Leu Leu Lys Glu Leu 
370 375 380 

Asp Val Asp Lys Ala Ala Thr He Ala Ala Phe Tyr Glu Phe Thr Lys 
385 390 395 400 

Glu Glu Leu Glu Phe Leu Val Gly Glu Lys Gly Asp Glu He Trp Lys 
405 410 415 

Tyr Val Glu Lys His Gly Met His Arg He Glu Asp Glu Thr Phe Leu 
420 425 430 

Glu Ser Phe Val Lys Ala Glu Lys Glu Glu Lys Glu Glu Ser Val Glu 
435 440 445 
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Glu Val Ala Glu Glu Lys Pro Glu Glu Glu Arg Glu Glu Pro Arg Ala 
450 455 460 

Arg Lys Lys Ala Gly Lys Asn Leu Thr Leu Asp Ser Phe Phe Ser 
465 470 475 

(2) ANGABEN ZU SEQ ID NO: 8: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 516 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Leu Ser Trp Val Glu Lys Tyr Arg Pro Lys Ser Leu Lys Asp Val 
1 5 10 15 

Ala Gly His Glu Lys Val Lys Glu Lys Leu Lys Thr Trp lie Glu Ser 
20 25 30 

Tyr Leu Lys Gly Glu Thr Pro Lys Pro lie Leu Leu Val Gly Pro Pro 
35 40 45 

Gly Cys Gly Lys Thr Thr Leu Ala Tyr Ala Leu Ala Asn Asp Tyr Gly 
50 55 60 

Phe Glu Val He Glu Leu Asn Ala Ser Asp Lys Arg Asn Ser Ser Ala 
65 70 75 80 

lie Lys Lys Val Val Gly His Ala Ala Thr Ser Ser Ser lie Phe Gly 
85 90 95 

Lys Lys Phe Leu lie Val Leu Asp Glu Val Asp Gly lie Ser Gly Lys 
100 105 110 

Glu Asp Ala Gly Gly Val Ser Glu Leu lie Lys Val He Lys Lys Ala 
115 120 125 
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Lys Asn Pro lie lie Leu Thr Ala Asn Asp Ala Tyr Ala Pro Ser lie 
130 135 140 

Arg Ser Leu Leu Pro Tyr Val Glu Val He Gin Leu Asn Pro Val His 
145 150 155 160 

Thr Asn Ser Val Tyr Lys Val Leu Lys Lys lie Ala Glu Lys Glu Gly 
165 170 175 

Leu Asp Val Asp Asp Lys Thr Leu Lys Met He Ala Gin His Ser Ala 
1 80 1 85 1 90 

Gly Asp Leu Arg Ser Ala lie Asn Asp Leu Glu Ala Leu Ala Leu Ser 
195 200 205 

Gly Asp Leu Ser Tyr Glu Ala Ala Gin Lys Leu Pro Asp Arg Lys Arg 
210 215 220 

Glu Ala Asn He Phe Asp Ala Leu Arg Val He Leu Lys Thr Thr His 
225 230 235 240 

Tyr Gly lie Ala Thr Thr Ala Leu Met Asn Val Asp Glu Thr Pro Asp 
245 250 255 

Val Val lie Glu Trp lie Ala Glu Asn Val Pro Lys Glu Tyr Glu Lys 
260 265 270 

Pro Glu Glu Val Ala Arg Ala Phe Glu Tyr Leu Ser Lys Ala Asp Arg 
275 280 285 

Tyr Leu Gly Arg Val Met Arg Arg Gin Asn Tyr Ser Phe Trp Lys Tyr 
290 295 300 

Ala Thr Thr Leu Met Thr Ala Gly Val Ala Leu Ser Lys Asp Glu Lys 
305 310 315 320 

Tyr Arg Lys Trp Thr Pro Tyr Ser Tyr Pro Lys He Phe Arg Leu Leu 
325 330 335 

Thr Lys Thr Lys Ala Glu Arg Glu He Leu Asn Lys He Leu Lys Lys 
340 345 350 

lie Gly Glu Lys Thr His Thr Ser Ser Lys Arg Ala Arg Phe Asp Leu 
355 360 365 

Gin Met Leu Lys Leu Leu Ala Lys Glu Asn Pro Ser Val Ala Ala Asp 
370 375 380 
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Leu Val Asp Tyr Phe Glu lie Lys Glu Asp Glu Leu Lys Val Leu Val 
385 390 395 400 

Gly Asp Lys Leu Ala Ser Glu He Leu Lys He Leu Lys Glu Lys Lys 
405 410 415 

Lys Leu Glu Arg Lys Lys Lys Lys Glu Lys Glu Lys Leu Glu Lys Glu 
420 " 425 430 

Lys Lys Lys Glu Glu Lys Ala Lys Glu Lys Gin Ser Asn Leu He lie 
435 440 445 

Gin Pro Lys Glu He Lys Glu Glu Val Lys Ala Glu Val Glu Lys Lys 
450 455 460 

Glu Glu Val Lys Glu Lys He Val Glu Lys Pro Lys Ala Glu Glu Val 
465 470 475 480 

Lys Glu Lys Ser Lys Thr Glu Glu Lys Glu Thr Lys Lys Asp Lys Lys 
485 490 495 

Lys Gly Lys Lys Lys Lys Glu Asp Lys Gly Lys Gin Leu Thr Leu Asp 
500 505 510 

Ala Phe Phe Lys 
515 

(2) ANGABEN ZU SEQ ID NO: 9: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 468 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

Met Pro Asp Val Pro Trp He Glu Lys Tyr Arg Pro Arg Lys Leu Ser 
1 5 10 15 
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Glu lie Val Asn Gin Glu Gin Ala Leu Glu Lys Val Arg Ala Trp lie 
20 25 30 

Glu Ser Trp Leu His Gly Asn Pro Pro Lys Lys Lys Ala Leu Leu Leu 
35 40 45 

Ala Gly Pro Pro Gly Ser Gly Lys Thr Thr Thr Val Tyr Ala Leu Ala 
50 55 60 

His Glu Tyr Asn Phe Glu Val He Glu Leu Asn Ala Ser Asp Glu Arg 
65 70 75 80 

Thr Tyr Asn Lys lie Ala Arg Tyr Val Gin Ala Ala Tyr Thr Met Asp 
85 90 95 

He Met Gly Lys Arg Arg Lys He He Phe Leu Asp Glu Ala Asp Asn 
100 105 110 

He Glu Pro Ser Gly Ala Pro Glu He Ala Lys Leu He Asp Lys Ala 
115 120 125 

Arg Asn Pro lie He Met Ala Ala Asn His Tyr Trp Glu Val Pro Lys 
130 135 140 

Glu lie Arg Asp Arg Ala Glu Leu Val Glu Tyr Lys Arg Leu Asn Gin 
145 150 155 160 

Arg Asp Val He Ser Ala Leu Val Arg He Leu Lys Arg Glu Gly He 
165 170 175 

Thr Val Pro Lys Glu He Leu Thr Glu lie Ala Lys Arg Ser Ser Gly 
180 185 190 

Asp Leu Arg Ala Ala lie Asn Asp Leu Gin Thr lie Val Ala Gly Gly 
195 200 205 

Tyr Glu Asp Ala Lys Tyr Val Leu Ala Tyr Arg Asp Val Glu Lys Thr 
210 215 220 

Val Phe. Gin Ser Leu Gly Met Val Phe Ser Ser Asp Asn Ala Lys Arg 
225 230 235 240 

Ala Lys Leu Ala Leu Met Asn Leu Asp Met Ser Pro Asp Glu Phe Leu 
245 250 255 

Leu Trp Val Asp Glu Asn He Pro His Met Tyr Leu Lys Pro Glu Glu 
260 265 270 
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Met Ala Arg Ala Tyr Glu Ala lie Ser Arg Ala Asp lie Tyr Leu Gly 
275 280 285 

Arg Ala Gin Arg Thr Gly Asn Tyr Ser Leu Trp Lys Tyr Ala lie Asp 
290 295 300 

Met Met Thr Ala Gly Val Ala Val Ala Gly Thr Lys Lys Lys Gly Phe 
305 310 315 320 

Ala Lys Phe Tyr Pro Pro Asn Thr Leu Lys Met Leu Ala Glu Ser Lys 
325 330 335 

Glu Glu Arg Ser lie Arg Asp Ser He He Lys Lys He Met Lys Glu 
340 345 350 

Met His Met Ser Lys Leu Glu Ala Leu Glu Thr Met Lys lie Leu Arg 
355 360 365 

Thr He Phe Glu Asn Asn Leu Asp Leu Ala Ala His Phe Thr Val Phe 
370 375 380 

Leu Glu Leu Thr Glu Lys Glu Val Glu Phe Leu Ala Gly Lys Glu Lys 
385 390 395 400 

Ala Gly Thr He Trp Gly Lys Thr Leu Ser He Arg Arg Arg He Lys 
405 ■ 410 415 

Glu Thr Glu Lys He Glu Glu Lys Ala Val Glu Glu Lys Val Glu Glu 
420 425 430 

Glu Glu Ala Glu Glu Glu Glu Glu Glu Glu Arg Lys Glu Glu Glu Lys 
435 440 445 

Pro Lys Ala Glu Lys Lys Lys Gly Lys Gin Val Thr Leu Phe Asp Phe 
450 455 460 

He Lys Lys Asn 
465 

(2) ANGABEN ZU SEQ ID NO: 10: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 479 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Ser Trp Thr Glu Lys Tyr Arg Pro Gly Ser Phe Asp Glu Val Val 
15 10 15 

Gly Asn Gin Lys Val He Ala Glu He Lys Glu Trp lie Lys Ala Trp 
20 25 30 

Lys Ala Gly Lys Pro Gin Lys Pro Leu Leu Leu Val Gly Pro Pro Gly 
35 40 45 

Thr Gly Lys Thr Thr Leu Ala His He He Gly Lys Glu Phe Ser Asp 
50 55 60 

Thr Leu Glu Leu Asn Ala Ser Asp Arg Arg Ser Gin Asp Ala Leu Met 
65 70 75 80 

Arg Ser Ala Gly Glu Ala Ser Ala Thr Arg Ser Leu Phe Asn His Asp 
85 90 95 

Leu Lys Leu He lie Leu Asp Glu Val Asp Gly He His Gly Asn Glu 
100 105 110 

Asp Arg Gly Gly Val Gin Ala lie Asn Arg He He Lys Glu Ser Arg 
115 120 125 

His Pro Met Val Leu Thr Ala Asn Asp Pro Tyr Ser Lys Arg Leu Gin 
130 135 140 

Ser He Lys Pro Arg Cys Arg Val Leu Asn Leu Arg Lys Val His Thr 
145 150 155 160 

Ser Ser He Ala Ala Ala Leu Arg Arg lie Cys Arg Ala Glu Gly He 
165 170 175 

Glu Cys Pro Asp Asp Val Leu Arg Glu Leu Ala Lys Arg Ser Arg Gly 
180 185 190 

Asp Leu Arg Ser Ala He Asn Asp Leu Glu Ala Met Ala Glu Gly Glu 
195 200 205 

Glu Arg lie Gly Glu Glu Leu Leu Lys Met Gly Glu Lys Asp Ala Thr 
210 215 220 
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Ser Asn Leu Phe Asp Ala Val Arg Ala Val Leu Lys Ser Arg Asp Val 
225 230 235 240 

Ser Lys Val Arg Glu Ala Met Arg Val Asp Asp Asp Pro Thr Leu Val 
245 250 255 



10 



Leu Glu Phe lie Ala Glu Asn Val Pro Arg Glu Tyr Glu Lys Pro Asn 
260 265 270 



15 



Glu He Ser Arg Ala Tyr Asp Met Leu Ser Arg Ala Asp lie Phe Phe 
275 280 285 



20 



Gly Arg Ala Val Arg Thr Arg Asn Tyr Thr Tyr Trp Arg Tyr Ala Ser 
290 295 300 

Glu Leu Met Gly Pro Gly Val Ala Leu Ala Lys Asp Lys Thr Tyr Arg 
305 310 315 320 



25 



Lys Phe Val Arg Tyr Thr Gly Ser Ser Ser Phe Arg lie Leu Gly Lys 
325 330 335 



30 



Thr Arg Lys Gin Arg Ser Leu Arg Asp Ser Val Ala Ala Lys Met Ala 
340 345 350 



35 



40 



Gly Lys Met His lie Ser Pro Lys Val Ala He Ser Met Phe Pro Tyr 
355 360 365 

Met Glu lie Leu Phe Glu Asn Asp Glu Met Ala Tyr Asp lie Ser Glu 
370 375 380 

Phe Leu Glu Leu Arg Asp Glu Glu lie Lys Leu Phe Arg Lys Arg Lys 
385 390 395 400 



45 He Lys Ala Pro Lys Arg Lys Lys Thr Pro Arg Lys Ala Glu lie Lys 
405 410 415 



50 



Val Gly Pro Leu Tyr Ser Gin Lys Lys Asp Lys Gly Ala Asp Lys Ser 
420 425 430 



55 



60 



He Asn Asp Lys Ala Thr Asp Lys Ser Ala Lys Thr Pro lie Lys Ser 
435 440 445 

Ser Lys Lys Asp Asp Arg Pro Arg Asp Glu Ser Ser Ser Ser Ser Asp 
450 455 460 

Asp Lys Lys Pro Lys Glu Lys Gin Thr Ser Leu Phe Gin Phe Ser 
465 470 475 
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(2) ANGABEN ZU SEQ ID NO: 11: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 261 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONUCHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Met Phe Glu Ala Arg Leu Val Gin Gly Ser lie Leu Lys Lys Val Leu 
15 10 15 

Glu Ala Leu Lys Asp Leu He Asn Glu Ala Cys Trp Asp He Ser Ser 
20 25 30 

Ser Gly Val Asn Leu Gin Ser Met Asp Ser Ser His Val Ser Leu Val 
35 40 45 

Gin Leu Thr Leu Arg Ser Glu Gly Phe Asp Thr Tyr Arg Cys Asp Arg 
50 55 60 

Asn Leu Ala Met Gly Val Asn Leu Thr Ser Met Ser Lys He Leu Lys 
65 70 75 80 

Cys Ala Gly Asn Glu Asp He He Thr Leu Arg Ala Glu Asp Asn Ala 
85 90 95 

Asp Thr Leu Ala Leu Val Phe Glu Ala Pro Asn Gin Glu Lys Val Ser 
100 105 110 

Asp Tyr Glu Met Lys Leu Met Asp Leu Asp Val Glu Gin Leu Gly He 
115 120 125 

Pro Glu Gin Glu Tyr Ser Cys Val Val Lys Met Pro Ser Gly Glu Phe 
130 135 140 

Ala Arg He Cys Arg Asp Leu Ser His lie Gly Asp Ala Val Val He 
145 150 155 160 
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Ser Cys Ala Lys Asp Gly Val Lys Phe Ser Ala Ser Gly Glu Leu Gly 
165 170 175 

Asn Gly Asn lie Lys Leu Ser Gin Thr Ser Asn Val Asp Lys Glu Glu 
180 185 190 

Glu Ala Val Thr lie Glu Met Asn Glu Pro Val Gin Leu Thr Phe Ala 
195 200 205 

Leu Arg Tyr Leu Asn Phe Phe Thr Lys Ala Thr Pro Leu Ser Ser Thr 
210 215 220 

Val Thr Leu Ser Met Ser Ala Asp Val Pro Leu Val Val Glu Tyr Lys 
225 230 235 240 

lie Ala Asp Met Gly His Leu Lys Tyr Tyr Leu Ala Pro Lys lie Glu 
245 250 255 

Asp Glu Glu Gly Ser 
260 

(2) ANGABEN ZU SEQ ID NO: 12: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 245 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met lie Asp Val lie Met Thr Gly Glu Leu Leu Lys Thr Val Thr Arg 
15 10 15 

Ala lie Val Ala Leu Val Ser Glu Ala Arg lie His Phe Leu Glu Lys 
20 25 30 

Gly Leu His Ser Arg Ala Val Asp Pro Ala Asn Val Ala Met Val lie 
35 40 45 
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Val Asp He Pro Lys Asp Ser Phe Glu Val Tyr Asn We Asp Glu Glu 
50 55 60 

Lys Thr lie Gly Val Asp Met Asp Arg lie Phe Asp lie Ser Lys Ser 
65 70 75 80 

lie Ser Thr Lys Asp Leu Val Glu Leu He Val Glu Asp Glu Ser Thr 
85 90 95 

Leu Lys Val Lys Phe Gly Ser Val Glu Tyr Lys Val Ala Leu lie Asp 
100 105 110 

Pro Ser Ala lie Arg Lys Glu Pro Arg He Pro Glu Leu Glu Leu Pro- 
115 120 125 

Ala Lys lie Val Met Asp Ala Gly Glu Phe Lys Lys Ala He Ala Ala 
130 135 140 

Ala Asp Lys He Ser Asp Gin Val He Phe Arg Ser Asp Lys Glu Gly 
145 150 155 160 

Phe Arg He Glu Ala Lys Gly Asp Val Asp Ser He Val Phe His Met 
165 170 175 

Thr Glu Thr Glu Leu He Glu Phe Asn Gly Gly Glu Ala Arg Ser Met 
180 185 190 

Phe Ser Val Asp Tyr Leu Lys Glu Phe Cys Lys Val Ala Gly Ser Gly 
195 200 205 

Asp Leu Leu Thr lie His Leu Gly Thr Asn Tyr Pro Val Arg Leu Val 
210 215 220 

Phe Glu Leu Val Gly Gly Arg Ala Lys Val Glu Tyr He Leu Ala Pro 
225 230 235 240 

Arg He Glu Ser Glu 
245 

(2) AIMGABEN ZU SEQ ID NO: 13: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 247 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) T0P0L0GIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

10 

Met Phe Arg Gly Val Met Glu Ser Ala Lys Glu Phe Lys Lys Val Val 
1 5 10 15 

is Asp Thr lie Ser Thr Leu Leu Asp Glu He Cys Phe Glu Val Asp Glu 
20 25 30 

Glu Gly lie Lys Ala Ser Ala Met Asp Pro Ser His Val Ala Leu Val 
20 35 40 45 

Ser Leu Glu lie Pro Arg Leu Ala Phe Glu Glu Tyr Glu Ala Asp Ser 
50 55 60 

25 

His Asp He Gly lie Asp Leu Glu Ala Phe Lys Lys Val Met Asn Arg 
65 70 75 80 

M Ala Lys Ala Lys Asp Arg Leu lie Leu Glu Leu Asp Glu Glu Lys Asn 
85 90 95 

35 Lys Leu Asn Val lie Phe Glu Asn Thr Gly Lys Arg Lys Phe Ser Leu 
100 105 110 

Ala Leu Leu Asp lie Ser Ala Ser Ser Val Lys Val Pro Glu lie Glu 
40 115 120 125 

Tyr Pro Asn Val lie Met lie Lys Gly Asp Ala Phe Lys Glu Ala Leu 
130 135 140 

45 

Lys Asp Ala Asp Leu Phe Ser Asp Tyr Val lie Leu Lys Ala Asp Glu 
145 150 155 160 

50 Asp Lys Phe Val lie His Ala Lys Gly Asp Leu Asn Glu Asn Glu Ala 
165 170 175 

lie Phe Glu Lys Asp Ser Ser Ala He lie Ser Leu Glu Val Lys Glu 
5S 180 185 190 

Glu Ala Lys Ser Ala Phe Asn Leu Asp Tyr Leu Met Asp Met Val Lys 
so 195 200 205 

Gly Val Ser Ser Gly Asp lie He Lys He Tyr Leu Gly Asn Asp Met 
210 215 220 
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Pro Leu Lys Leu Glu Tyr Ser lie Ala Gly Val Asn Leu Thr Phe Leu 
225 230 235 240 

Leu Ala Pro Arg lie Glu Gly 
245 

(2) ANGABEN ZU SEQ ID NO: 14: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 249 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Met Pro Phe Glu lie Val Phe Glu Gly Ala Lys Glu Phe Ala Gin Leu 
15 10 15 

lie Glu Thr Ala Ser Arg Leu He Asp Glu Ala Ala Phe Lys Val Thr 
20 25 30 

Glu Glu Gly lie Ser Met Arg Ala Met Asp Pro Ser Arg Val Val Leu 
35 40 45 

He Asp Leu Asn Leu Pro Ser Ser He Phe Ser Lys Tyr Glu Val Asp 
50 55 60 

Gly Glu Glu Thr lie Gly Val Asn Met Asp His Leu Lys Lys Val Leu 
65 70 75 80 

Lys Arg Gly Lys Ala Lys Asp Thr Leu He Leu Arg Lys Gly Glu Glu 
85 90 95 

Asn Phe Leu Glu He Ser Leu Gin Gly Thr Ala Thr Arg Thr Phe Arg 
100 105 110 

Leu Pro Leu He Asp Val Glu Glu He Glu Val Glu Leu Pro Asp Leu 
115 120 125 
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Pro Tyr Thr Ala Lys Val Val Val Leu Gly Glu Val Leu Lys Glu Ala 
130 135 140 

Val Lys Asp Ala Ser Leu Val Ser Asp Ser lie Lys Phe Met Ala Lys 
145 150 155 160 

Glu Asn Glu Phe lie Met Arg Ala Glu Gly Glu Thr Gin Glu Val Glu 
165 170 175 

Val Lys Leu Thr Leu Glu Asp Glu Gly Leu Leu Asp lie Glu Val Gin 
180 185 190 

Glu Glu Thr Lys Ser Ala Tyr Gly Val Ser Tyr Leu Ala Asp Met Val 
195 200 205 

Lys Gly He Gly Lys Ala Asp Glu Val Thr Met Arg Phe Gly Asn Glu 
210 215 220 

Met Pro Met Gin Met Glu Tyr Tyr lie Arg Asp Glu Gly Arg Leu Thr 
225 230 235 240 

Phe Leu Leu Ala Pro Arg Val Glu Glu 
245 

(2) ANGABEN ZU SEQ ID NO: 15: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 244 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
(0) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

Met Phe Lys Ala Glu Leu Asn Asp Pro Asn lie Leu Arg Thr Ser Phe 
15 10 15 

Asp Ala lie Ser Ser lie Val Asp Glu Val Gin lie Gin Leu Ser Ala 
20 25 30 
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Glu Gly Leu Arg Leu Asp Ala Leu Asp Arg Ser His lie Thr Tyr Val 
35 40 45 

His Leu Glu Leu Lys Ala Glu Leu Phe Asp Glu Tyr Val Cys Asp Glu 
50 55 60 

Pro Glu Arg lie Asn Val Asp Thr Glu Glu Leu Met Lys Val Leu Lys 
65 70 75 80 

Arg Ala Lys Ala Asn Asp Arg Val lie Leu Ser Thr Asp Glu Gly Asn 
85 90 95 

Leu He lie Gin Phe Glu Gly Glu Ala Val Arg Thr Phe Lys lie Arg 
100 105 110 

Leu He Asp He Glu Tyr Glu Thr Pro Ser Pro Pro Glu lie Glu Tyr 
115 120 125 

Glu Asn Glu Phe Glu Val Pro Phe Gin Leu Leu Lys Asp Ser lie Ala 
130 135 140 

Asp He Asp lie Phe Ser Asp Lys He Thr Phe Arg Val Asp Glu Asp 
145 150 155 160 

Arg Phe lie Ala Ser Ala Glu Gly Glu Phe Gly Asp Ala Gin lie Glu 
165 170 175 

Tyr Leu His Gly Glu Arg He Asp Lys Pro Ala Arg Ser lie Tyr Ser 
180 185 190 

Leu Asp Lys lie Lys Glu Met Leu Lys Ala Asp Lys Phe Ser Glu Thr 
1 95 200 205 

Ala lie He Asn Leu Gly Asp Asp Met Pro Leu Lys Leu Thr Leu Lys 
210 215 220 

Met Ala Ser Lys Glu Gly Glu Leu Ser Phe Leu Leu Ala Pro Arg He 
225 230 235 240 

Glu Ala Glu Glu 



(2) ANGABEN ZU SEQ ID NO: 16: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 469 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
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(D) TOPOLOGIE: linear 

(if) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Phe Ser Glu Gin Ala Ala Gin Arg Ala His Thr Leu Leu Ser Pro 
15 10 15 

20 Pro Ser Ala Asn Asn Ala Thr Phe Ala Arg Val Pro Val Ala Thr Tyr 
20 25 30 

Thr Asn Ser Ser Gin Pro Phe Arg Leu Gly Glu Arg Ser Phe Ser Arg 
25 35 40 45 

Gin Tyr Ala His He Tyr Ala Thr Arg Leu lie Gin Met Arg Pro Phe 
50 55 60 

30 

Leu Glu Asn Arg Ala Gin Gin His Trp Gly Ser Gly Val Gly Val Lys 
65 70 75 80 

Lys Leu Cys Glu Leu Gin Pro Glu Glu Lys Cys Cys Val Val Gly Thr 
85 90 95 

40 Leu Phe Lys Ala Met Pro Leu Gin Pro Ser lie Leu Arg Glu Val Ser 
100 105 110 

Glu Glu His Asn Leu Leu Pro Gin Pro Pro Arg Ser Lys Tyr lie His 
45 115 120 125 

Pro Asp Asp Glu Leu Val Leu Glu Asp Glu Leu Gin Arg He Lys Leu 
130 135 140 

50 

Lys Gly Thr He Asp Val Ser Lys Leu Val Thr Gly Thr Val Leu Ala 
145 150 155 160 

55 Val Phe Gly Ser Val Arg Asp Asp Gly Lys Phe Leu Val Glu Asp Tyr 
165 170 175 

Cys Phe Ala Asp Leu Ala Pro Gin Lys Pro Ala Pro Pro Leu Asp Thr 
60 180 185 190 



35 
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Asp Arg Phe Val Leu Leu Val Ser Gly Leu Gly Leu Gly Gly Gly Gly 
195 200 205 

Gly Glu Ser Leu Leu Gly Thr Gin Leu Leu Val Asp Val Val Thr Gly 
210 215 220 

Gin Leu Gly Asp Glu Gly Glu Gin Cys Ser Ala Ala His Val Ser Arg 
225 230 235 240 

Val He Leu Ala Gly Asn Leu Leu Ser His Ser Thr Gin Ser Arg Asp 
245 250 255 

Ser He Asn Lys Ala Lys Tyr Leu Thr Lys Lys Thr Gin Ala Ala Ser 
260 265 270 

Val Glu Ala Val Lys Met Leu Asp Glu lie Leu Leu Gin Leu Ser Ala 
275 280 285 

Ser Val Pro Val Asp Val Met Pro Gly Glu Phe Asp Pro Thr Asn Tyr 
290 295 300 

Thr Leu Pro Gin Gin Pro Leu His Pro Cys Met Phe Pro Leu Ala Thr 
305 310 315 320 

Ala Tyr Ser Thr Leu Gin Leu Val Thr Asn Pro Tyr Gin Ala Thr He 
325 330 335 

Asp Gly Val Arg Phe Leu Gly Thr Ser Gly Gin Asn Val Ser Asp lie 
340 345 350 

Phe Arg Tyr Ser Ser Met Glu Asp His Leu Glu lie Leu Glu Trp Thr 
355 360 365 

Leu Arg Val Arg His He Ser Pro Thr Ala Pro Asp Thr Leu Gly Cys 
370 375 380 

Tyr Pro Phe Tyr Lys Thr Asp Pro Phe lie Phe Pro Glu Cys Pro His 
385 390 395 400 

Val Tyr Phe Cys Gly Asn Thr Pro Ser Phe Gly Ser Lys He lie Arg 
405 410 415 

Gly Pro Glu Asp Gin Thr Val Leu Leu Val Thr Val Pro Asp Phe Ser 
420 425 430 

Ala Thr Gin Thr Ala Cys Leu Val Asn Leu Arg Ser Leu Ala Cys Gin 
435 440 445 
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Pro lie Ser Phe Ser Gly Phe Gly Ala Glu Asp Asp Asp Leu Gly Gly 
450 455 460 

Leu Gly Leu Gly Pro 
465 

(2) ANGABEN ZU SEQ ID NO: 17: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 488 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONUCHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

Met Val He Lys Asn lie Asp Ala Ala Thr Val Ala Lys Lys Phe Leu 
15 10 15 

Val Arg Gly Tyr Asn He Asp Pro Lys Ala Ala Glu Leu lie Cys Lys 
20 25 30 

Ser Gly Leu Phe Ser Asp Glu Leu Val Asp Lys lie Cys Arg lie Ala 
35 40 45 

Asn Gly Gly Phe lie He Glu Lys Ser Val Val Glu Glu Phe Leu Arg 
50 55 60 

Asn Leu Ser Asn Leu Lys Pro Ala Thr Leu Thr Pro Arg Pro Glu Glu 
65 70 75 80 

Arg Lys Val Glu Glu Val Lys Ala Ser Cys He Ala Leu Lys Val He 
85 90 95 

Lys Asp He Thr Gly Lys Ser Ser Cys Gin Gly Asn Val Glu Asp Phe 
100 105 110 

Leu Met Tyr Phe Asn Ser Arg Leu Glu Lys Leu Ser Arg lie lie Arg 
115 1 20 1 25 
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Ser Arg Val Asn Thr Thr Pro lie Ala His Ala Gly Lys Val Arg Gly 
130 135 140 

Asn Val Ser Val Val Gly Met Val Asn Glu Val Tyr Glu Arg Gly Asp 
145 150 155 160 

Lys Cys Tyr lie Arg Leu Glu Asp Thr Thr Gly Thr lie Thr Cys Val 
165 ~ 170 175 

Ala Thr Gly Lys Asn Ala Glu Val Ala Arg Glu Leu Leu Gly Asp Glu 
180 185 190 

Val lie Gly Val Thr Gly Leu Leu Lys Gly Ser Ser Leu Tyr Ala Asn 
1 95 200 205 

Arg lie Val Phe Pro Asp Val Pro lie Asn Gly Asn Gly Glu Lys Lys 
210 215 220 

Arg Asp Phe Tyr He Val Phe Leu Ser Asp Thr His Phe Gly Ser Lys 
225 230 235 240 

Glu Phe Leu Glu Lys Glu Trp Glu Met Phe Val Arg Trp Leu Lys Gly 
245 250 255 

Glu Val Gly Gly Lys Lys Ser Gin Asn Leu Ala Glu Lys Val Lys Tyr 
260 265 270 

lie Val lie Ala Gly Asp He Val Asp Gly He Gly Val Tyr Pro Gly 
275 280 285 

Gin Glu Asp Asp Leu Ala lie Ser Asp He Tyr Gly Gin Tyr Glu Phe 
290 295 300 

Ala Ala Ser His Leu Asp Glu lie Pro Lys Glu He Lys lie He Val 
305 310 315 320 

Ser Pro Gly Asn His Asp Ala Val Arg Gin Ala Glu Pro Gin Pro Ala 
325 . 330 335 

Phe Glu Gly Glu He Arg Ser Leu Phe Pro Lys Asn Val Glu His Val 
340 345 350 

Gly Asn Pro Ala Tyr Val Asp He Glu Gly Val Lys Val Leu He Tyr 
355 360 365 

His Gly Arg Ser lie Asp Asp lie He Ser Lys He Pro Arg Leu Ser 
370 375 380 
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Tyr Asp Glu Pro Gin Lys Val Met Glu Glu Leu Leu Lys Arg Arg His 
385 390 395 400 

Leu Ser Pro He Tyr Gly Gly Arg Thr Pro Leu Ala Pro Glu Arg Glu 
405 410 415 

Asp Tyr Leu Val lie Glu Asp Val Pro Asp lie Leu His Cys Gly His 
420 425 430 

lie His Thr Tyr Gly Thr Gly Phe Tyr Arg Gly Val Phe Met Val Asn 
435 440 445 

Ser Ser Thr Trp Gin Ala Gin Thr Glu Phe Gin Lys Lys Val Asn Leu 
450 455 460 

Asn Pro Met Pro Gly Asn Val Ala Val Tyr Arg Pro Gly Gly Glu Val 
465 470 475 480 

He Arg Leu Arg Phe Tyr Gly Glu 
485 

(2) ANGABEN ZU SEQ ID NO: 1 8: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Met Glu He lie Asn Lys Phe Leu Asp Leu Glu Ala Leu Leu Ser Pro 
1.5 10 15 

Thr Val Tyr Glu Lys Leu Lys Asn Phe Asp Glu Glu Lys Leu Lys Arg 
20 25 30 

Leu lie Gin Lys He Arg Glu Phe Lys Lys Tyr Asn Asn Ala Phe lie 
35 40 45 
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Leu Leu Asp Glu Lys Phe Leu Asp lie Phe Leu Gin Lys Asp Leu Asp 
50 55 60 

Glu lie lie Asn Glu Tyr Lys Asp Phe Asp Phe lie Phe Tyr Tyr Thr 
65 70 75 80 

Gly Glu Glu Glu Lys Glu Lys Pro Lys. Glu Val Lys Lys Glu He Lys 
85 90 95 

Lys Glu Thr Glu Glu Lys lie Glu Lys Glu Lys lie Glu Phe Val Lys 
100 105 110 

Lys Glu Glu Lys Glu Gin Phe lie Lys Lys Ser Asp Glu Asp Val Glu 
115 120 125 

Glu Lys Leu Lys Gin Leu He Ser Lys Glu Glu Lys Lys Glu Asp Phe 
130 135 140 

Asp Ala Glu Arg Ala Lys Arg Tyr Glu His He Thr Lys He Lys Glu 
145 150 155 160 

Ser Val Asn Ser Arg He Lys Trp He Ala Lys Asp lie Asp Ala Val 
165 170 175 

lie Glu He Tyr Glu Asp Ser Asp Val Ser Gly Lys Ser Thr Cys Thr 
180 185 190 

Gly Thr He Glu Asp Phe Val Lys Tyr Phe Arg Asp Arg Phe Glu Arg 
1 95 200 205 

Leu Lys Val Phe He Glu Arg Lys Ala Gin Arg Lys Gly Tyr Pro Leu 
210 215 220 

Lys Asp He Lys Lys Met Lys Gly Gin Lys Asp He Phe Val Val Gly 
225 230 235 240 

lie Val Ser Asp Val Asp Ser Thr Arg Asn Gly Asn Leu lie Val Arg 
245 250 255 

He Glu Asp Thr Glu Asp Glu Ala Thr Leu He Leu Pro Lys Glu Lys 
260 265 270 

He Glu Ala Gly Lys He Pro Asp Asp He Leu Leu Asp Glu Val He 
275 280 285 

Gly Ala lie Gly Thr Val Ser Lys Ser Gly Ser Ser lie Tyr Val Asp 
290 295 300 
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Glu He lie Arg Pro Ala Leu Pro Pro Lys Glu Pro Lys Arg He Asp 
305 310 315 320 

5 Glu Glu He Tyr Met Ala Phe Leu Ser Asp lie His Val Gly Ser Lys 
325 330 335 

Glu Phe Leu His Lys Glu Phe Glu Lys Phe He Arg Phe Leu Asn Gly 
! 340 345 350 

Asp Val Asp Asn Glu Leu Glu Glu Lys Val Val Ser Arg Leu Lys Tyr 
1S 355 360 365 

lie Cys He Ala Gly Asp Leu Val Asp Gly Val Gly Val Tyr Pro Gly 
370 375 380 

20 

Gin Glu Glu Asp Leu Tyr Glu Val Asp He He Glu GIn Tyr Arg Glu 
385 390 395 400 

25 He Ala Met Tyr Leu Asp Gin He Pro Glu His He Ser He He He 
405 410 415 

Ser Pro Gly Asn His Asp Ala Val Arg Pro Ala Glu Pro Gin Pro Lys 
30 420 425 430 

Leu Pro Glu Lys lie Thr Lys Leu Phe Asn Arg Asp Asn He Tyr Phe 
3J 435 440 445 

Val Gly Asn Pro Cys Thr Leu Asn He His Gly Phe Asp Thr Leu Leu 
450 455 460 

40 

Tyr His Gly Arg Ser Phe Asp Asp Leu Val Gly Gin He Arg Ala Ala 
465 470 475 480 

as Ser Tyr Glu Asn Pro Val Thr He Met Lys Glu Leu lie Lys Arg Arg 
485 490 495 

Leu Leu Cys Pro Thr Tyr Gly Gly Arg Cys Pro He Ala Pro Glu His 
so 500 505 510 

Lys Asp Tyr Leu Val He Asp Arg Asp He Asp He Leu His Thr Gly 
515 520 525 

55 

His lie His lie Asn Gly Tyr Gly He Tyr Arg Gly Val Val Met Val 
530 535 540 

60 Asn Ser Gly Thr Phe Gin Glu Gin Thr Asp Phe Gin Lys Arg Met Gly 
545 550 555 560 



65 
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He Ser Pro Thr Pro Ala lie Val Pro lie lie Asn Met Ala Lys Val 
565 570 575 

Gly Glu Lys Gly His Tyr Leu Glu Trp Asp Arg Gly Val Leu Glu Val 
580 585 590 

Arg Tyr 



(2) ANGABEN ZU SEQ ID NO: 19: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 622 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

Met Asp Glu Phe Val Lys Gly Leu Met Lys Asn Gly Tyr Leu He Thr 
15 10 15 

Pro Ser Ala Tyr Tyr Leu Leu Val Gly His Phe Asn Glu Gly Lys Phe 
20 25 30 

Ser Leu lie Glu Leu He Lys Phe Ala Lys Ser Arg Glu Thr Phe He 
35 40 45 

He Asp Asp Glu lie Ala Asn Glu Phe Leu Lys Ser He Gly Ala Glu 
50 55 60 

Val Glu Leu Pro Gin Glu lie Lys Glu Gly Tyr He Ser Thr Gly Glu 
65 70 75 80 

Gly Ser Gin Lys Val Pro Asp His Glu Glu Leu Glu Lys lie Thr Asn 
85 90 95 

Glu Ser Ser Val Glu Ser Ser He Ser Thr Gly Glu Thr Pro Lys Thr 
100 105 110 
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Glu Glu Leu Gin Pro Thr Leu Asp lie Leu Glu Glu Glu lie Gly Asp 
115 120 125 

5 lie Glu Gly Gly Glu Ser Ser lie Ser Thr Gly Asp Glu Val Pro Glu 
130 135 140 

Val Glu Asn Asn Asn Gly Gly Thr Val Val Val Phe Asp Lys Tyr Gly 
10 U5 150 155 160 

Tyr Pro Phe Thr Tyr Val Pro Glu Glu lie Glu Glu Glu Leu Glu Glu 
,s 165 170 175 

Tyr Pro Lys Tyr Glu Asp Val Thr lie Glu lie Asn Pro Asn Leu Glu 
180 185 190 

20 

Val Val Pro lie Glu Lys Asp Tyr Glu lie Lys Phe Asp Val Arg Arg 
195 200 205 

25 Val Lys Leu Lys Pro Pro Lys Val Lys Ser Gly Ser Gly Lys Glu Gly 
210 215 220 

Glu He lie Val Glu Ala Tyr Ala Ser Leu Phe Arg Ser Arg Leu Arg 

30 225 230 235 240 

Lys Leu Arg Arg lie Leu Arg Glu Asn Pro Glu Val Ser Asn Val He 
35 245 250 255 

Asp lie Lys Lys Leu Lys Tyr Val Lys Gly Asp Glu Glu Val Thr lie 
260 265 270 

40 

lie Gly Leu Val Asn Ser Lys Lys Glu Thr Ser Lys Gly Leu lie Phe 
275 280 285 

45 Glu Val Glu Asp Gin Thr Asp Arg Val Lys Val Phe Leu Pro Lys Asp 
290 295 300 

Ser Glu Asp Tyr Arg Glu Ala Leu Lys Val Leu Pro Asp Ala Val Val 
50 305 310 315 320 

Ala Phe Lys Gly Val Tyr Ser Lys Arg Gly lie Phe Phe Ala Asn Arg 
325 330 335 

55 

Phe Tyr Leu Pro Asp Val Pro Leu Tyr Arg Lys Gin Lys Pro Pro Leu 
340 345 350 

60 Glu Glu Lys Val Tyr Ala Val Leu Thr Ser Asp lie His Val Gly Ser 
355 360 365 
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Lys Glu Phe Cys Glu Lys Ala Phe He Lys Phe Leu Glu Trp Leu Asn 
370 375 380 

Gly Tyr Val Glu Ser Lys Glu Glu Glu Glu lie Val Ser Arg He Arg 
385 390 395 400 

Tyr Leu He lie Ala Gly Asp Val Val Asp Gly He Gly lie Tyr Pro 
405 410 415 

Gly Gin Tyr Ser Asp Leu He He Pro Asp He Phe Asp Gin Tyr Glu 
420 425 430 

Ala Leu Ala Asn Leu Leu Ser Asn Val Pro Lys His He Thr He Phe 
435 440 445 

lie Gly Pro Gly Asn His Asp Ala Ala Arg Pro Ala He Pro Gin Pro 
450 455 460 

Glu Phe Tyr Glu Glu Tyr Ala Lys Pro Leu Tyr Lys Leu Lys Asn Thr 
465 470 475 480 

Val lie lie Ser Asn Pro Ala Val He Arg Leu His Gly Arg Asp Phe 
485 490 495 

Leu lie Ala His Gly Arg Gly He Glu Asp Val Val Ser Phe Val Pro 
500 505 510 

Gly Leu Thr His His Lys Pro Gly Leu Pro Met Val Glu Leu Leu Lys 
515 520 525 

Met Arg His Leu Ala Pro Thr Phe Gly Gly Lys Val Pro lie Ala Pro 
530 535 540 

Asp Pro Glu Asp Leu Leu Val He Glu Glu Val Pro Asp Leu Val Gin 
545 550 555 560 

Met Gly His Val His Val Tyr Asp Thr Ala Val Tyr Arg Gly Val Gin 
565 570 575 

Leu Val Asn Ser Ala Thr Trp Gin Ala Gin Thr Glu Phe Gin Lys Met 
580 585 590 

Val Asn lie Val Pro Thr Pro Gly Leu Val Pro lie Val Asp Val Glu 
595 600 605 

Ser Ala Arg Val He Lys Val Leu Asp Phe Ser Arg Trp Cys 
610 615 620 
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(2) ANGABEN ZU SEQ ID NO: 20: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 482 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

Met Asn Glu lie He Gly Lys Phe Ala Arg Glu Gly lie Leu lie Glu 
15 10 15 

Asp Asn Ala Tyr Phe Arg Leu Arg Glu Met Asp Asp Pro Ala Ser Val 
20 25 30 

Ser Ser Glu Leu lie Val Lys lie Lys Ser Asn Gly Gly Lys Phe Thr 
35 40 45 

Val Leu Thr Ser Glu Met Leu Asp Glu Phe Phe Glu lie Asp Asn Pro 
50 55 60 

Ala Glu He Lys Ala Arg Gly Pro Leu Met Val Pro Ala Glu Arg Asp 
65 70 75 80 

Phe Asp Phe Glu Val He Ser Asp Thr Ser Asn Arg Ser Tyr Thr Ser 
85 90 95 

Gly Glu He Gly Asp Met lie Ala Tyr Phe Asn Ser Arg Tyr Ser Ser 
100 105 110 

Leu Lys Asn Leu Leu Ser Lys Arg Pro Glu Leu Lys Gly His lie Pro 
115 120 125 

lie Ala Asp Leu Arg Gly Gly Glu Asp Val Val Ser He He Gly Met 
130 135 140 

Val Asn Asp Val Arg Asn Thr Lys Asn Asn His Arg He He Glu Leu 
145 150 155 160 
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Glu Asp Asp Thr Gly Glu He Ser Val Val Val His Asn Glu Asn His 
165 170 175 

Lys Leu Phe Glu Lys Ser Glu Lys He Val Arg Asp Glu Val Val Gly 
180 185 190 

Val His Gly Thr Lys Lys Gly Arg Phe Val Val Ala Ser Glu He Phe 
195 200 205 

His Pro Gly Val Pro Arg lie Gin Glu Lys Glu Met Asp Phe Ser Val 
210 215 220 

Ala Phe He Ser Asp Val His lie Gly Ser Gin Thr Phe Leu Glu Asp 
225 230 235 240 

Ala Phe Met Lys Phe Val Lys Trp lie Asn Gly Asp Phe Gly Ser Glu 
245 250 255 

Glu Gin Arg Ser Leu Ala Ala Asp Val Lys Tyr Leu Val Val Ala Gly 
260 265 270 

Asp lie Val Asp Gly lie Gly lie Tyr Pro Gly Gin Glu Lys Glu Leu 
275 280 285 

Leu He Arg Asp He His Glu Gin Tyr Glu Glu Ala Ala Arg Leu Phe 
290 295 300 

Gly Asp lie Arg Ser Asp He Lys He Val Met lie Pro Gly Asn His 
305 310 315 320 

Asp Ser Ser Arg He Ala Glu Pro Gin Pro Ala lie Pro Glu Glu Tyr 
325 330 335 

Ala Lys Ser Leu Tyr Ser He Arg Asn He Glu Phe Leu Ser Asn Pro 
340 345 350 

Ser Leu Val Ser Leu Asp Gly Val Arg Thr Leu He Tyr His Gly Arg 
355 360 365 

Ser Phe Asp Asp Met Ala Met Ser Val Asn Gly Leu Ser His Glu Arg 
370 375 380 

Ser Asp Leu He Met Glu Glu Leu Leu Glu Lys Arg His Leu Ala Pro 
385 390 395 400 

He Tyr Gly Glu Arg Thr Pro Leu Ala Ser Glu lie Glu Asp His Leu 
405 410 415 
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Val lie Asp Glu Val Pro His Val Leu His Thr Gly His Val His lie 
420 425 430 

Asn Ala Tyr Lys Lys Tyr Lys Gly Val His Leu lie Asn Ser Gly Thr 
435 440 445 

Phe Gin Ser Gin Thr Glu Phe Gin Lys lie Tyr Asn lie Val Pro Thr 
450 . 455 460 

Cys Gly Gin Val Pro Val Leu Asn Arg Gly Val Met Lys Leu Leu Glu 
465 470 475 480 

Phe Ser 



(2) ANGABEN ZU SEQ ID NO: 21: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 613 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus furiosus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

Met Asp Glu Phe Val Lys Ser Leu Leu Lys Ala Asn Tyr Leu He Thr 
15 10 15 

Pro Ser Ala Tyr Tyr Leu Leu Arg Glu Tyr Tyr Glu Lys Gly Glu Phe 
20 25 30 

Ser He Val Glu Leu Val Lys Phe Ala Arg Ser Arg Glu Ser Tyr lie 
35 40 45 

lie Thr Asp Ala Leu Ala Thr Glu Phe Leu Lys Val Lys Gly Leu Glu 
50 55 60 

Pro He Leu Pro Val Glu Thr Lys Gly Gly Phe Val Ser Thr Gly Glu 
65 70 75 80 
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Ser Gin Lys Glu Gin Ser Tyr Glu Glu Ser Phe Gly Thr Lys Glu Glu 
85 90 95 

He Ser Gin Glu lie Lys Glu Gly Glu Ser Phe lie Ser Thr Gly Ser 
100 105 110 

Glu Pro Leu Glu Glu Glu Leu Asn Ser He Gly lie Glu Glu lie Gly 
115 120 125 

Ala Asn Glu Glu Leu Val Ser Asn Gly Asn Asp Asn Gly Gly Glu Ala 
130 135 140 

lie Val Phe Asp Lys Tyr Gly Tyr Pro Met Val Tyr Ala Pro Glu Glu 
145 150 155 160 

lie Glu Val Glu Glu Lys Glu Tyr Ser Lys Tyr Glu Asp Leu Thr He 
165 170 175 

Pro Met Asn Pro Asp Phe Asn Tyr Val Glu He Lys Glu Asp Tyr Asp 
180 185 190 

Val Val Phe Asp Val Arg Asn Val Lys Leu Lys Pro Pro Lys Val Lys 
195 200 205 

Asn Gly Asn Gly Lys Glu Gly Glu lie lie Val Glu Ala Tyr Ala Ser 
210 215 220 

Leu Phe Arg Ser Arg Leu Lys Lys Leu Arg Lys lie Leu Arg Glu Asn 
225 230 235 240 

Pro Glu Leu Asp Asn Val Val Asp lie Gly Lys Leu Lys Tyr Val Lys 
245 250 255 

Glu Asp Glu Thr Val Thr lie lie Gly Leu Val Asn Ser Lys Arg Glu 
260 265 270 

Val Asn Lys Gly Leu lie Phe Glu He Glu Asp Leu Thr Gly Lys Val 
275 280 285 

Lys Val Phe Leu Pro Lys Asp Ser Glu Asp Tyr Arg Glu Ala Phe Lys 
290 295 300 

Val Leu Pro Asp Ala Val Val Ala Phe Lys Gly Val Tyr Ser Lys Arg 
305 310 315 320 

Gly He Leu Tyr Ala Asn Lys Phe Tyr Leu Pro Asp Val Pro Leu Tyr 
325 330 335 
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Arg Arg Gin Lys Pro Pro Leu Glu Glu Lys Val Tyr Ala He Leu lie 
340 345 350 

5 Ser Asp lie His Val Gly Ser Lys Glu Phe Cys Glu Asn Ala Phe lie 
355 360 365 

, 0 Lys Phe Leu Glu Trp Leu Asn Gly Asn Val Glu Thr Lys Glu Glu Glu 
370 375 380 

Glu He Val Ser Arg Val Lys Tyr Leu He lie Ala Gly Asp Val Val 
is 385 390 395 400 

Asp Gly Val Gly Val Tyr Pro Gly Gin Tyr Ala Asp Leu Thr lie Pro 
405 410 415 

20 

Asp He Phe Asp Gin Tyr Glu Ala Leu Ala Asn Leu Leu Ser His Val 
420 425 430 

25 Pro Lys His lie Thr Met Phe He Ala Pro Gly Asn His Asp Ala Ala 
435 440 445 

Arg Gin Ala He Pro Gin Pro Glu Phe Tyr Lys Glu Tyr Ala Lys Pro 
30 450 455 460 

He Tyr Lys Leu Lys Asn Ala Val lie lie Ser Asn Pro Ala Val He 
35 465 470 475 480 

Arg Leu His Gly Arg Asp Phe Leu lie Ala His Gly Arg Gly He Glu 
485 490 495 

40 

Asp Val Val Gly Ser Val Pro Gly Leu Thr His His Lys Pro Gly Leu 
500 505 510 

45 Pro Met Val Glu Leu Leu Lys Met Arg His Val Ala Pro Met Phe Gly 
515 520 525 

Gly Lys Val Pro lie Ala Pro Asp Pro Glu Asp Leu Leu Val lie Glu 
50 530 535 540 

Glu Val Pro Asp Val Val His Met Gly His Val His Val Tyr Asp Ala 
545 550 555 560 

55 

Val Val Tyr Arg Gly Val Gin Leu Val Asn Ser Ala Thr Trp Gin Ala 
565 570 575 

60 

Gin Thr Glu Phe Gin Lys Met Val Asn He Val Pro Thr Pro Ala Lys 
580 585 590 
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Vat Pro Val Val Asp lie Asp Thr Ala Lys Val Val Lys Val Leu Asp 
595 600 605 

Phe Ser Gly Trp Cys 
610 

(2) ANGABEN ZU SEQ ID NO: 22: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1107 AminosMuren 

(B) ART: Aminosaure 

(C) STRANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys 
15 10 15 

Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Trp Pro Ser 
20 25 30 

Gin Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His 
35 40 45 

Arg Leu Gin Glu Gin Glu Glu Glu Glu Leu Gin Ser Val Leu Glu Gly 
50 55 60 

Val Ala Asp Gly Gin Val Pro Pro Ser Ala He Asp Pro Arg Trp Leu 
65 70 75 80 

Arg Pro Thr Pro Pro Ala Leu Asp Pro Gin Thr Glu Pro Leu lie Phe 
85 90 95 

Gin Gin Leu Glu lie Asp His Tyr Val Gly Pro Ala Gin Pro Val Pro 
100 105 110 

Gly Gly Pro Pro Pro Ser Arg Gly Ser Val Pro Val Leu Arg Ala Phe 
115 120 125 
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Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His lie His Gly Phe 
130 135 140 

5 Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His 
145 150 155 160 

10 Met Gly Asp Leu Gin Arg Glu Leu Asn Leu Ala lie Ser Arg Asp Ser 
165 170 175 

Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu 
is " 180 185 190 

Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro 
195 200 205 

20 

Phe Leu Arg lie Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg 
210 ~ 215 220 

25 Arg Leu Leu Glu Gin Gly lie Arg Val Ala Gly Leu Gly Thr Pro Ser 
225 230 235 240 



30 



35 



Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu He Arg Phe Met Val 
245 250 255 

Asp Thr Asp He Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys 



260 



265 



270 



40 



Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gin Cys Gin Leu Glu Ala 
275 280 285 ' 

Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp 
290 295 300 



45 Gin Arg lie Ala Pro Leu Arg Val Leu Ser Phe Asp He Glu Cys Ala 
305 " 310 315 320 

Gly Arg Lys Gly He Phe Pro Glu Pro Glu Arg Asp Pro Val He Gin 

50 325 330 335 

lie Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg 
340 345 350 



55 



60 



Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro He Leu Gly Ala Lys Val 
355 360 365 

Gin Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gin Ala Trp Ser Thr Phe 
370 375 380 
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lie Arg lie Met Asp Pro Asp. Val lie Thr Gly Tyr Asn lie Gin Asn 
385 390 395 400 

Phe Asp Leu Pro Tyr Leu lie Ser Arg Ala Gin Thr Leu Lys Val Gin 
405 410 415 

Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn lie Arg 
420 425 430 

Asp Ser Ser Phe Gin Ser Lys Gin Thr Gly Arg Arg Asp Thr Lys Val 
435 440 445 

Val Ser Met Val Gly Arg Val Gin Met Asp Met Leu Gin Val Leu Leu 
450 455 460 

Arg Glu Tyr Lys Leu Arg Ser His Thr Leu Asn Ala Val Ser Phe His 
465 470 475 480 

Phe Leu Gly Glu Gin Lys Glu Asp Val Gin His Ser lie lie Thr Asp 
485 490 495 

Leu Gin Asn Gly Asn Asp Gin Thr Arg Arg Arg Leu Ala Val Tyr Cys 
500 505 510 

Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val 
515 520 525 

Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser 
530 535 540 

Tyr Leu Leu Ser Arg Gly Gin Gin Val Lys Val Val Ser Gin Leu Leu 
545 550 555 560 

Arg Gin Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu 
565 570 575 

Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val lie Glu Pro Leu Lys Gly 
580 585 590 

Tyr Tyr Asp Val Pro He Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro 
595 600 605 

Ser He Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro 
610 615 620 

Gly Thr Ala Gin Lys Leu Gly Leu Thr Glu Asp Gin Phe lie Arg Thr 
625 630 635 640 
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Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu 
645 650 655 

Pro Gin lie Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala 
660 665 670 

Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gin Val Leu Asp Gly 
675 680 685 

Arg Gin Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr 



690 



695 



700 



Gly Ala Gin Val Gly Lys Leu Pro Cys Leu Glu lie Ser Gin Ser Val 
705 710 715 720 

Thr Gly Phe Gly Arg Gin Met lie Glu Lys Thr Lys Gin Leu Val Glu 
725 730 735 



25 Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val 
740 745 750 



30 



35 



40 



Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val 
755 760 765 

Ala Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly 



770 



775 



780 



His Phe Pro Ser Pro He Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro 
785 790 795 800 

Tyr Leu Leu He Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser 
805 810 815 



4S Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val 
820 825 830 



Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu 
50 835 840 845 

Arg Arg Leu Leu He Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala 
850 855 860 



55 



60 



Gin Asp Val He Ser Asp Leu Leu Cys Asn Arg He Asp lie Ser Gin 
865 870 875 880 

Leu Val He Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly 
885 890 895 
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Lys Gin Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro 
900 905 910 

Gly S r Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val lie lie Ser 
915 920 925 

Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe 
930 935 940 

Val Leu Glu His Ser Leu Pro lie Asp Thr Gin Tyr Tyr Leu Glu Gin 
945 950 955 960 

Gin Leu Ala Lys Pro Leu Leu Arg lie Phe Glu Pro He Leu Gly Glu 
965 970 975 

Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys 
980 985 990 

Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg 
995 1000 1005 

Arg Asn Cys Cys lie Gly Cys Arg Thr Val Leu Ser His Gin Gly Ala 
1010 1015 1020 

Val Cys Glu Phe Cys Gin Pro Arg Glu Ser Glu Leu Tyr Gin Lys Glu 
1025 1030 1035 1040 

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr 
1045 1050 1055 

Gin Cys Gin Arg Cys Gin Gly Ser Leu His Glu Asp Val He Cys Thr 
1060 1065 1070 

Ser Arg Asp Cys Pro He Phe Tyr Met Arg Lys Lys Val Arg Lys Asp 
1075 1080 1085 

Leu Glu Asp Gin Glu Gin Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro 
1090 1095 1100 

Glu Ala Trp 
1105 

(2) ANGABEN ZU SEQ ID NO: 23: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 781 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



10 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

is 

Met Glu Arg Val Glu Gly Trp Leu He Asp Ala Asp Tyr Glu Thr lie 
15 10 15 

20 Gly Gly Lys Ala Val Val Arg Leu Trp Cys Lys Asp Asp Gin Gly He 
20 25 30 

Phe Val Ala Tyr Asp Tyr Asn Phe Asp Pro Tyr Phe Tyr Val He Gly 
25 35 40 45 

Val Asp Glu Asp lie Leu Lys Asn Ala Ala Thr Ser Thr Arg Arg Glu 
50 55 60 

30 

Val He Lys Leu Lys Ser Phe Glu Lys Ala Gin Leu Lys Thr Leu Gly 
65 70 75 80 

Arg Glu Val Glu Gly Tyr lie Val Tyr Ala His His Pro Gin His Val 
85 90 95 

40 Pro Lys Leu Arg Asp Tyr Leu Ser Gin Phe Gly Asp Val Arg Glu Ala 
100 105 110 

Asp He Pro Phe Ala Tyr Arg Tyr Leu lie Asp Lys Asp Leu Ala Cys 
« 115 120 125 

Met Asp Gly He Ala lie Glu Gly Glu Lys Gin Gly Gly Val He Arg 
130 135 140 

so 

Ser Tyr Lys He Glu Lys Val Glu Arg He Pro Arg Met Glu Phe Pro 
145 150 155 160 

55 Glu Leu Lys Met Leu Val Phe Asp Cys Glu Met Leu Ser Ser Phe Gly 
165 170 175 

Met Pro Glu Pro Glu Lys Asp Pro He He Val He Ser Val Lys Thr 
180 185 190 
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Asn Asp Asp Asp Glu He He Leu Thr Gly Asp Glu Arg Lys He He 
195 200 205 

Ser Asp Phe Val Lys Leu He Lys Ser Tyr Asp Pro Asp He He Val 
210 215 220 

Gly Tyr Asn Gin Asp Ala Phe Asp Trp Pro Tyr Leu Arg Lys Arg Ala 
225 230 235 240 

Glu Arg Trp Asn He Pro Leu Asp Val Gly Arg Asp Gly Ser Asn Val 
245 250 . 255 

Val Phe Arg Gly Gly Arg Pro Lys lie Thr Gly Arg Leu Asn Val Asp 
260 265 270 

Leu Tyr Asp He Ala Met Arg He Ser Asp lie Lys lie Lys Lys Leu 
275 280 285 

Glu Asn Val Ala Glu Phe Leu Gly Thr Lys He Glu lie Ala Asp He 
290 295 300 

Glu Ala Lys Asp lie Tyr Arg Tyr Trp Ser Arg Gly Glu Lys Glu Lys 
305 310 315 320 

Val Leu Asn Tyr Ala Arg Gin Asp Ala He Asn Thr Tyr Leu He Ala 
325 330 335 

Lys Glu Leu Leu Pro Met His Tyr Glu Leu Ser Lys Met He Arg Leu 
340 345 350 

Pro Val Asp Asp Val Thr Arg Met Gly Arg Gly Lys Gin Val Asp Trp 
355 360 365 

Leu Leu Leu Ser Glu Ala Lys Lys He Gly Glu lie Ala Pro Asn Pro 
370 375 380 

Pro Glu His Ala Glu Ser Tyr Glu Gly Ala Phe Val Leu Glu Pro Glu 
385 390 395 400 

Arg Gly Leu His Glu Asn Val Ala Cys Leu Asp Phe Ala Ser Met Tyr 
405 410 415 

Pro Ser He Met He Ala Phe Asn He Ser Pro Asp Thr Tyr Gly Cys 
420 425 430 

Arg Asp Asp Cys Tyr Glu Ala Pro Glu Val Gly His Lys Phe Arg Lys 
435 440 • 445 
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Ser Pro Asp Gly Phe Phe Lys Arg lie Leu Arg Met Leu He Glu Lys 
450 455 460 

Arg Arg Glu Leu Lys Val Glu Leu Lys Asn Leu Ser Pro Glu Ser Ser 
465 ~ 470 475 480 

Glu Tyr Lys Leu Leu Asp He Lys Gin Gin Thr Leu Lys Val Leu Thr 
485 490 495 

Asn Ser Phe Tyr Gly Tyr Met Gly Trp Asn Leu Ala Arg Trp Tyr Cys 
500 505 510 

His Pro Cys Ala Glu Ala Thr Thr Ala Trp Gly Arg His Phe He Arg 
515 520 525 

Thr Ser Ala Lys He Ala Glu Ser Met Gly Phe Lys Val Leu Tyr Gly 
530 535 540 

Asp Thr Asp Ser He Phe Val Thr Lys Ala Gly Met Thr Lys Glu Asp 
545 550 555 560 

Val Asp Arg Leu lie Asp Lys Leu His Glu Glu Leu Pro lie Gin He 
565 570 575 



35 



40 



45 



50 



Glu Val Asp Glu Tyr Tyr Ser Ala He Phe Phe Val Glu Lys Lys Arg 
580 585 590 

Tyr Ala Gly Leu Thr Glu Asp Gly Arg Leu Val Val Lys Gly Leu Glu 
595 600 605 

Val Arg Arg Gly Asp Trp Cys Glu Leu Ala Lys Lys Val Gin Arg Glu 
610 615 620 

Val He Glu Val He Leu Lys Glu Lys Asn Pro Glu Lys Ala Leu Ser 
625 630 635 640 

Leu Val Lys Asp Val lie Leu Arg He Lys Glu Gly Lys Val Ser Leu 
645 650 655 



55 



60 



Glu Glu Val Val He Tyr Lys Gly Leu Thr Lys Lys Pro Ser Lys Tyr 
660 665 670 

Glu Ser Met Gin Ala His Val Lys Ala Ala Leu Lys Ala Arg Glu Met 
675 680 685 

Gly He He Tyr Pro Val Ser Ser Lys lie Gly Tyr Val He Val Lys 
690 695 700 
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Gly Ser Gly Asn lie Gly Asp Arg Ala Tyr Pro He Asp Leu He Glu 
705 710 715 720 

Asp Phe Asp Gly Glu Asn Leu Arg lie Lys Thr Lys Ser Gly lie Glu 
725 730 735 

lie Lys Lys Leu Asp Lys Asp Tyr Tyr He Asp Asn Gin He lie Pro 
740 745 750 

Ser Val Leu Arg lie Leu Glu Arg Phe Gly Tyr Thr Glu Ala Ser Leu 
755 760 765 

Lys Gly Ser Ser Gin Met Ser Leu Asp Ser Phe Phe Ser 
770 775 780 

(2) ANGABEN ZU SEQ ID NO: 24: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1634 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Met Gly Met Ser Met Gly Lys He Lys lie Asp Ala Leu lie Asp Asn 
1 5 10 15 

Thr Tyr Lys Thr lie Glu Asp Lys Ala Val He Tyr Leu Tyr Leu He 
20 25 30 

Asn Ser He Leu Lys Asp Arg Asp Phe Lys Pro Tyr Phe Tyr Val Glu 
35 40 45 

Leu His Lys Glu Lys Val Glu Asn Glu Asp He Glu Lys lie Lys Glu 
50 55 60 

Phe Leu Leu Lys Asn Asp Leu Leu Lys Phe Val Glu Asn He Glu Val 
65 70 75 80 
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Val Lys Lys lie lie Leu Arg Lys Glu Lys Glu Val He Lys He He 
85 90 95 

Ala Thr His Pro Gin Lys Val Pro Lys Leu Arg Lys lie Lys Glu Cys 
100 105 110 

Glu lie Val Lys Glu He Tyr Glu His Asp lie Pro Phe Ala Lys Arg 
115 120 125 

Tyr Leu He Asp Asn Glu He He Pro Met Thr Tyr Trp Asp Phe Glu 
130 135 140 

Asn Lys Lys Pro Val Ser He Glu He Pro Lys Leu Lys Ser Val Ala 
145 .150 155 160 

Phe Asp Met Glu Val Tyr Asn Arg Asp Thr Glu Pro Asn Pro Glu Arg 
165 170 175 

Asp Pro He Leu Met Ala Ser Phe Trp Asp Glu Asn Gly Gly Lys Val 
180 185 190 

He Thr Tyr Lys Glu Phe Asn His Pro Asn He Glu Val Val Lys Asn 
195 200 205 

Glu Lys Glu Leu lie Lys Lys He lie Glu Thr Leu Lys Glu Tyr Asp 
210 215 220 

Val lie Tyr Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Lys 
225 230 235 240 

Ala Arg Ala Lys lie Tyr Gly He Asp lie Asn Leu Gly Lys Asp Gly 
245 250 255 

Glu Glu Leu Lys lie Lys Arg Gly Gly Met Glu Tyr Arg Ser Tyr He 
260 265 270 

Pro Gly Arg Val His He Asp Leu Tyr Pro He Ser Arg Arg Leu Leu 
275 280 285 

Lys Leu Thr Lys Tyr Thr Leu Glu Asp Val Val Tyr Asn Leu Phe Gly 
290 295 300 

He Glu Lys Leu Lys He Pro His Thr Lys He Val Asp Tyr Trp Ala 
305 310 315 320 

Asn Asn Asp Lys Thr Leu He Glu Tyr Ser Leu Gin Asp Ala Lys Tyr 
325 330 335 
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Thr Tyr Lys lie Gly Lys Tyr Phe Phe Pro Leu Glu Val Met Phe Ser 
340 345 350 

Arg He Val Asn Gin Thr Pro Phe Glu lie Thr Arg Met Ser Ser Gly 
355 360 365 

Gin Met Val Glu Tyr Leu Leu Met Lys Arg Ala Phe Lys Glu Asn Met 
370 375 380 

lie Val Pro Asn Lys Pro Asp Glu Glu Glu Tyr Arg Arg Arg Val Leu 
385 390 395 400 

Thr Thr Tyr Glu Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly Met Phe 
405 410 415 

Glu Asp lie lie Ser Met Asp Phe Arg Cys His Pro Lys Gly Thr Lys 
420 425 430 

Val Val Val Lys Gly Lys Gly lie Val Asn lie Glu Asp Val Lys Glu 
435 440 445 

Gly Asn Tyr Val Leu Gly He Asp Gly Trp Gin Lys Val Lys Lys Val 
450 455 460 

Trp Lys Tyr Glu Tyr Glu Gly Glu Leu lie Asn Val Asn Gly Leu Lys 
465 470 475 480 

Cys Thr Pro Asn His Lys lie Pro Leu Arg Tyr Lys He Lys His Lys 
485 490 495 

Lys He Asn Lys Asn Asp Tyr Leu Val Arg Asp He Tyr Ala Lys Ser 
500 505 510 

Leu Leu Thr Lys Phe Lys Gly Glu Gly Lys Leu He Leu Cys Lys Asp 
515 520 525 

Phe Glu Thr He Gly Asn Tyr Glu Lys Tyr He Asn Asp Met Asp Glu 
530 535 540 

Asp Phe He Leu Lys Ser Glu Leu lie Gly lie Leu Leu Ala Glu Gly 
545 550 555 560 

His Leu Leu Arg Arg Asp He Glu Tyr Phe Asp Ser Ser Arg Gly Lys 
565 570 575 

Lys Arg lie Ser His Gin Tyr Arg Val Glu He Thr Val Asn Glu Asp 
580 585 590 
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Glu Lys Asp Phe lie Glu Lys lie Lys Tyr lie Phe Lys Lys Leu Phe 
595 600 605 

S Asn Tyr Glu Leu Tyr Val Arg Arg Lys Lys Gly Thr Lys Ala lie Thr 
610 615 620 

l0 Leu Gly Cys Ala Lys Lys Asp lie Tyr Leu Lys He Glu Glu lie Leu 
625 630 635 640 

Lys Asn Lys Glu Lys Tyr Leu Pro Asn Ala He Leu Arg Gly Phe Phe 
is 645 650 655 

Glu Gly Asp Gly Tyr Val Asn Thr Val Arg Arg Ala Val Val Val Asn 
660 665 670 

20 

Gin Gly Thr Asn Asn Tyr Asp Lys He Lys Phe lie Ala Ser Leu Leu 
675 680 685 

25 Asp Arg Leu Gly He Lys Tyr Ser Phe Tyr Thr Tyr Ser Tyr Glu Glu 
690 695 700 

Arg Gly Lys Lys Leu Lys Arg Tyr Val He Glu He Phe Ser Lys Gly 
30 705 710 ~ 715 720 

Asp Leu He Lys Phe Ser He Leu lie Ser Phe lie Ser Arg Arg Lys 
35 725 730 735 

Asn Asn Leu Leu Asn Glu He He Arg Gin Lys Thr Leu Tyr Lys He 
740 745 750 

40 

Gly Asp Tyr Gly Phe Tyr Asp Leu Asp Asp Val Cys Val Ser Leu Glu 
755 760 765 

« Ser Tyr Lys Gly Glu Val Tyr Asp Leu Thr Leu Glu Gly Arg Pro Tyr 
770 775 780 

Tyr Phe Ala Asn Gly He Leu Thr His Asn Ser Leu Tyr Pro Ser lie 
50 785 790 795 800 

He He Ser Tyr Asn lie Ser Pro Asp Thr Leu Asp Cys Glu Cys Cys 
805 810 815 

$s 

Lys Asp Val Ser Glu Lys He Leu Gly His Trp Phe Cys Lys Lys Lys 
820 825 830 

60 

Glu Gly Leu lie Pro Lys Thr Leu Arg Asn Leu He Glu Arg Arg He 
835 840 845 
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Asn lie Lys Arg Arg Met Lys Lys Met Ala Glu lie Gly Glu lie Asn 
850 855 860 

Glu Glu Tyr Asn Leu Leu Asp Tyr Glu Gin Lys Ser Leu Lys lie Leu 
865 870 875 880 

Ala Asn Ser He Leu Pro Asp Glu Tyr Leu Thr lie lie Glu Glu Asp 
885 890 895 

Gly lie Lys Val Val Lys lie Gly Glu Tyr He Asp Asp Leu Met Arg 
900 905 910 

Lys His Lys Asp Lys lie Lys Phe Ser Gly lie Ser Glu lie Leu Glu 
915 920 925 

Thr Lys Asn Leu Lys Thr Phe Ser Phe Asp Lys He Thr Lys Lys Cys 
930 935 940 

Glu lie Lys Lys Val Lys Ala Leu He Arg His Pro Tyr Phe Gly Lys 
945 950 955 960 

Ala Tyr Lys He Lys Leu Arg Ser Gly Arg Thr He Lys Val Thr Arg 
965 970 975 

Gly His Ser Leu Phe Lys Tyr Glu Asn Gly Lys lie Val Glu Val Lys 
980 985 990 

Gly Asp Asp Val Arg Phe Gly Asp Leu He Val Val Pro Lys Lys Leu 
995 1000 1005 

Thr Cys Val Asp Lys Glu Val Val He Asn lie Pro Lys Arg Leu He 
1010 1015 1020 

Asn Ala Asp Glu Glu Glu lie Lys Asp Leu Val lie Thr Lys His Lys 
1025 1030 1035 1040 

Asp Lys Ala Phe Phe Val Lys Leu Lys Lys Thr Leu Glu Asp lie Glu 
1045 1050 1055 

Asn Asn Lys Leu Lys Val He Phe Asp Asp Cys lie Leu Tyr Leu Lys 
1060 1065 1070 

Glu Leu Gly Leu He Asp Tyr Asn lie lie Lys Lys He Asn Lys Val 
1075 1080 1085 

Asp lie Lys He Leu Asp Glu Glu Lys Phe Lys Ala Tyr Lys Lys Tyr 
1090 1095 1100 
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Phe Asp Thr Val He Glu His Gly Asn Phe Lys Lys Gly Arg Cys Asn 
1105 1110 1115 1120 

s He Gin Tyr He Lys He Lys Asp Tyr He Ala Asn lie Pro Asp Lys 
1125 1130 1135 

Glu Phe Glu Asp Cys Glu He Gly Ala Tyr Ser Gly Lys He Asn Ala 
1140 1145 1150 

Leu Leu Lys Leu Asp Glu Lys Leu Ala Lys Phe Leu Gly Phe Phe Val 
is 1155 1160 1165 

Thr Arg Gly Arg Leu Lys Lys Gin Lys Leu Lys Gly Glu Thr Val Tyr 
1170 1175 1180 

20 

Glu He Ser Val Tyr Lys Ser Leu Pro Glu Tyr Gin Lys Glu lie Ala 
1185 1190 1195 1200 

25 Glu Thr Phe Lys Glu Val Phe Gly Ala Gly Ser Met Val Lys Asp Lys 
1205 1210 1215 

Val Thr Met Asp Asn Lys He Val Tyr Leu Val Leu Lys Tyr He Phe 
J0 1220 1225 1230 

Lys Cys Gly Asp Lys Asp Lys Lys His He Pro Glu Glu Leu Phe Leu 
35 1235 1240 1245 

Ala Ser Glu Ser Val He Lys Ser Phe Leu Asp Gly Phe Leu Lys Ala 
1250 1255 1260 

40 

Lys Lys Asn Ser His Lys Gly Thr Ser Thr Phe Met Ala Lys Asp Glu 
1265 1270 1275 1280 

45 Lys Tyr Leu Asn Gin Leu Met He Leu Phe Asn Leu Val Gly He Pro 
1285 1290 1295 

Thr Arg Phe Thr Pro Val Lys Asn Lys Gly Tyr Lys Leu Thr Leu Asn 
50 1300 1305 1310 

Pro Lys Tyr Gly Thr Val Lys Asp Leu Met Leu Asp Glu Val Lys Glu 
1315 1320 1325 

55 

lie Glu Ala Phe Glu Tyr Ser Gly Tyr Val Tyr Asp Leu Ser Val Glu 
1330 1335 1340 

60 

Asp Asn Glu Asn Phe Leu Val Asn Asn He Tyr Ala His Asn Ser Val 
1345 1350 1355 1360 



6S 
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Tyr Gly Tyr Leu Ala Phe Pro Arg Ala Arg Phe Tyr Ser Arg Glu Cys 
1365 1370 1375 

Ala Glu lie Val Thr Tyr Leu Gly Arg Lys Tyr lie Leu Glu Thr Val 
1380 1385 1390 

Lys Glu Ala Glu Lys Phe Gly Phe Lys Val Leu Tyr lie Asp Thr Asp 
1395 1400 1405 

Gly Phe Tyr Ala He Trp Lys Glu Lys lie Ser Lys Glu Glu Leu He 
1410 1415 1420 

Lys Lys Ala Met Glu Phe Val Glu Tyr lie Asn Ser Lys Leu Pro Gly 
U25 1430 1435 1440 

Thr Met Glu Leu Glu Phe Glu Gly Tyr Phe Lys Arg Gly lie Phe Val 
1445 1450 1455 

Thr Lys Lys Arg Tyr Ala Leu He Asp Glu Asn Gly Arg Val Thr Val 
1460 1465 1470 

Lys Gly Leu Glu Phe Val Arg Arg Asp Trp Ser Asn lie Ala Lys lie 
1475 1480 1485 

Thr Gin Arg Arg Val Leu Glu Ala Leu Leu Val Glu Gly Ser He Glu 
1490 " 1495 1500 

Lys Ala Lys Lys He lie Gin Asp Val He Lys Asp Leu Arg Glu Lys 
1505 1510 1515 1520 

Lys He Lys Lys Glu Asp Leu He He Tyr Thr Gin Leu Thr Lys Asp 
1525 1530 1535 

Pro Lys Glu Tyr Lys Thr Thr Ala Pro His Val Glu lie Ala Lys Lys 
1540 1545 1550 

Leu Met Arg Glu Gly Lys Arg lie Lys Val Gly Asp lie He Gly Tyr 
1555 1560 1565 

He He Val Lys Gly Thr Lys Ser He Ser Glu Arg Ala Lys Leu Pro 
1570 1575 1580 

Glu Glu Val Asp He Asp Asp He Asp Val Asn Tyr Tyr lie Asp Asn 
1585 1590 1595 1600 

Gin He Leu Pro Pro Val Leu Arg lie Met Glu Ala Val Gly Val Ser 
1605 1610 1615 
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Lys Asn Glu Leu Lys Lys Glu Gly Ala Gin Leu Thr Leu Asp Lys Phe 
1620 1625 1630 



Phe Lys 



(2) ANGABEN ZU SEQ ID NO: 25: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1235 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

Met lie Leu Asp Ala Asp Tyr lie Thr Glu Asp Gly Lys Pro lie lie 
15 10 15 

Arg lie Phe Lys Lys Glu Asn Gly Glu Phe Lys Val Glu Tyr Asp Arg 
20 25 30 

Asn Phe Arg Pro Tyr lie Tyr Ala Leu Leu Arg Asp Asp Ser Ala lie 
35 40 45 

Asp Glu He Lys Lys lie Thr Ala Gin Arg His Gly Lys Val Val Arg 
50 55 60 

lie Val Glu Thr Glu Lys lie Gin Arg Lys Phe Leu Gly Arg Pro He 
65 70 75 80 

Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gin Asp Val Pro Ala lie 
85 90 95 

Arg Asp Lys lie Arg Glu His Pro Ala Val Val Asp He Phe Glu Tyr 
100 105 110 

Asp He Pro Phe Ala Lys Arg Tyr Leu He Asp Lys Gly Leu Thr Pro 
115 120 125 
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Met Glu Gly Asn Glu Lys Leu Thr Phe Leu Ala Val Asp lie Glu Thr 
130 135 140 

Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Val Me Met lie 
145 150 155 160 

Ser Tyr Ala Asp Glu Glu Gly Ala Lys Val lie Thr Trp Lys Lys lie 
165 170 175 

Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met lie Lys 
180 185 190 

Arg Leu lie Arg Val He Lys Glu Lys Asp Pro Asp Val He He Thr 
195 200 205 

Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu 
210 215 220 

Lys Leu Gly He Lys Leu Leu Leu Gly Arg Asp Asn Ser Glu Pro Lys 
225 230 235 240 

Met Gin Lys Met Gly Asp Ser Leu Ala Val Glu lie Lys Gly Arg lie 
245 250 255 

His Phe Asp Leu Phe Pro Val lie Arg Arg Thr lie Asn Leu Pro Thr 
260 265 270 

Tyr Thr Leu Glu Ala Val Tyr Glu Ala He Phe Gly Lys Pro Lys Glu 
275 280 285 

Lys Val Tyr Ala Asp Glu lie Ala Lys Ala Trp Glu Thr Gly Glu Gly 
290 295 300 

Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
305 310 315 320 

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gin Leu Ala Arg Leu 
325 330 335 

Val Gly Gin Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
340 345 350 

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
355 360 365 

Pro Asn Lys Pro Asp Glu Lys Glu Tyr Glu Arg Arg Leu Arg Glu Ser 
370 375 380 
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Tyr Glu Gly Gly Tyr Val Lys Glu Pro Glu Lys G!y Leu Trp Glu Gly 
385 390 -395 400 

He Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro Ser lie He He Thr 
405 • 410 415 



10 



His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Glu Glu Tyr 
420 425 430 



15 



Asp Val Ala Pro Lys Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly 
435 440 445 



20 



Phe He Pro Ser Leu Leu Gly Gin Leu Leu Glu Glu Arg Gin Lys He 
450 455 460 

Lys Lys Arg Met Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu 
465 470 475 480 



25 



Asp Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser He Leu Pro 
485 490 495 



30 



Asp Glu Trp Leu Pro lie Val Glu Asn Glu Lys Val Arg Phe Val Lys 
500 505 510 



35 



40 



He Gly Asp Phe lie Asp Arg Glu He Glu Glu Asn Ala Glu Arg Val 
515 520 525 

Lys Arg Asp Gly Glu Thr Glu He Leu Glu Val Lys Asp Leu Lys Ala 
530 535 540 

Leu Ser Phe Asn Arg Glu Thr Lys Lys Ser Glu Leu Lys Lys Val Lys 
545 550 555 560 



45 



Ala Leu He Arg His Arg Tyr Ser Gly Lys Val Tyr Ser He Lys Leu 
565 570 575 



50 



Lys Ser Gly Arg Arg He Lys lie Thr Ser Gly His Ser Leu Phe Ser 
580 585 590 



55 



60 



Val Lys Asn Gly Lys Leu Val Lys Val Arg Gly Asp Glu Leu Lys Pro 
595 600 605 

Gly Asp Leu Val Val Val Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys 
610 615 620 

Gin Val Leu Asn Leu Val Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu 
625 630 635 640 
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Thr Ser Asn He Val Met Met lie Pro Val Lys Gly Arg Lys Asn Phe 
645 650 655 

Phe Lys Gly Met Leu Lys Thr Leu Tyr Trp He Phe Gly Glu Gly Glu 
660 665 670 

Arg Pro Arg Thr Ala Gly Arg Tyr Leu Lys His Leu Glu Arg Leu Gly 
675 680 685 

Tyr Val Lys Leu Lys Arg Arg Gly Cys Glu Val Leu Asp Trp Glu Ser 
690 695 700 

Leu Lys Arg Tyr Arg Lys Leu Tyr Glu Thr Leu He Lys Asn Leu Lys 
705 710 715 720 

Tyr Asn Gly Asn Ser Arg Ala Tyr Met Val Glu Phe Asn Ser Leu Arg 
725 730 735 

Asp Val Val Ser Leu Met Pro He Glu Glu Leu Lys Glu Trp lie He 
740 745 750 

Gly Glu Pro Arg Gly Pro Lys He Gly Thr Phe He Asp Val Asp Asp 
755 760 765 

Ser Phe Ala Lys Leu Leu Gly Tyr Tyr He Ser Ser Gly Asp Val Glu 
770 775 780 

Lys Asp Arg Val Lys Phe His Ser Lys Asp Gin Asn Val Leu Glu Asp 
785 790 795 800 

He Ala Lys Leu Ala Glu Lys Leu Phe Gly Lys Val Arg Arg Gly Arg 
805 810 815 

Gly Tyr lie Glu Val Ser Gly Lys lie Ser His Ala He Phe Arg Val 
820 825 830 

Leu Ala Glu Gly Lys Arg He Pro Glu Phe He Phe Thr Ser Pro Met 
835 840 845 

Asp He Lys Val Ala Phe Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu 
850 855 860 

Leu Thr Phe Ser Thr Lys Ser Glu Leu Leu Val Asn Gin Leu lie Leu 
865 870 875 880 

Leu Leu Asn Ser He Gly Val Ser Asp lie Lys He Glu His Glu Lys 
885 890 895 
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Gly Val Tyr Arg Val Tyr He Asn Lys Lys Glu Ser Ser Asn Gly Asp 
900 905 910 

s He Val Leu Asp Ser Val Glu Ser He Glu Val Glu Lys Tyr Glu Gly 
915 920 925 

10 Tyr Val Tyr Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly 
930 935 940 

Phe Gly Leu Leu Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr 
,s 945 950 955 960 

Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala 
965 970 975 

20 

Trp Gly Arg Gin Tyr lie Asp Leu Val Arg Arg Glu Leu Glu Ala Arg 
980 985 990 

25 Gly Phe Lys Val Leu Tyr He Asp Thr Asp Gly Leu Tyr Ala Thr lie 
995 1000 1005 

Pro Gly Val Lys Asp Trp Glu Glu Val Lys Arg Arg Ala Leu Glu Phe 
J0 1010 1015 1020 

Val Asp Tyr lie Asn Ser Lys Leu Pro Gly Val Leu Glu Leu Glu Tyr 
3S 1025 1030 1035 1040 

Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala 
1045 1050 1055 

40 

Leu lie Asp Glu Glu Gly Lys lie Val Thr Arg Gly Leu Glu He Val 
1060 1065 1070 

45 Arg Arg Asp Trp Ser Glu lie Ala Lys Glu Thr Gin Ala Arg Val Leu 
1075 1080 1085 

Glu Ala lie Leu Lys His Gly Asn Val Glu Glu Ala Val Lys He Val 
so 1090 1095 1100 

Lys Asp Val Thr Glu Lys Leu Thr Asn Tyr Glu Val Pro Pro Glu Lys 
1105 1110 1115 1120 

5S 

Leu Val He Tyr Glu Gin He Thr Arg Pro He Asn Glu Tyr Lys Ala 
1125 1130 1135 

60 lie Gly Pro His Val Ala Val Ala Lys Arg Leu Met Ala Arg Gly He 
1.140 1145 1150 
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Lys Val Lys Pro Gly Met Val He Gly Tyr lie Val Leu Arg Gly Asp 
1155 1160 1165 

Gly Pro lie Ser Lys Arg Ala He Ser He Glu Glu Phe Asp Pro Arg 
1170 1175 1180 

Lys His Lys Tyr Asp Ala Glu Tyr Tyr lie Glu Asn Gin Val Leu Pro 
1185 1190 1195 1200 

Ala Val Glu Arg lie Leu Lys Ala Phe Gly Tyr Lys Arg Glu Asp Leu 
1205 1210 1215 

Arg Trp Gin Lys Thr Lys Gin Val Gly Leu Gly Ala Trp lie Lys Val 
1220 1225 1230 

Lys Lys Ser 
1235 

(2) ANGABEN ZU SEQ ID NO: 26: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 586 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Met Glu Asp Tyr Arg Met Val Leu Leu Asp lie Asp Tyr Val Thr Val 
15 10 15 

Asp Glu Val Pro Val lie Arg Leu Phe Gly Lys Asp Lys Ser Gly Gly 
20 25 - 30 

Asn Glu Pro He He Ala His Asp Arg Ser Phe Arg Pro Tyr He Tyr 
35 40 45 

Ala He Pro Thr Asp Leu Asp Glu Cys Leu Arg Glu Leu Glu Glu Leu 
50 55 60 
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Glu Leu Glu Lys Leu Glu Val Lys Glu Met Arg Asp Leu Gly Arg Pro 
65 70 75 80 

5 Thr Glu Val lie Arg lie Glu Phe Arg His Pro Gin Asp Val Pro Lys 
85 90 95 

I0 lie Arg Asp Arg He Arg Asp Leu Glu Ser Val Arg Asp He Arg Glu 
100 105 110 

His Asp lie Pro Phe Tyr Arg Arg Tyr Leu lie Asp Lys Ser He Val 
is 115 120 125 

Pro Met Glu Glu Leu Glu Phe Gin Gly Val Glu Val Asp Ser Ala Pro 
130 135 140 

20 

Ser Val Thr Thr Asp Val Arg Thr Val Glu Val Thr Gly Arg Val Gin 
145 150 155 160 

25 Ser Thr Gly Ser Gly Ala His Gly Leu Asp lie Leu Ser Phe Asp He 
165 170 175 

Glu Val Arg Asn Pro His Gly Met Pro Asp Pro Glu Lys Asp Glu lie 
30 180 185 190 

Val Met He Gly Val Ala Gly Asn Met Gly Tyr Glu Ser Val He Ser 
35 195 200 205 

Thr Ala Gly Asp His Leu Asp Phe Val Glu Val Val Glu Asp Glu Arg 
210 215 220 

40 

Glu Leu Leu Glu Arg Phe Ala Glu lie Val He Asp Lys Lys Pro Asp 
225 230 235 240 

45 He Leu Val Gly Tyr Asn Ser Asp Asn Phe Asp Phe Pro Tyr He Thr 
245 250 255 

Arg Arg Ala Ala lie Leu Gly Ala Glu Leu Asp Leu Gly Trp Asp Gly 
» 260 265 270 

Ser Lys lie Arg Thr Met Arg Arg Gly Phe Ala Asn Ala Thr Ala lie 
275 280 285 

55 

Lys Gly Thr Val His Val Asp Leu Tyr Pro Val Met Arg Arg Tyr Met 
290 295 300 

60 Asn Leu Asp Arg Tyr Thr Leu Glu Arg Val Tyr Gin Glu Leu Phe Gly 
305 310 315 320 
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Glu Glu Lys lie Asp Leu Pro Gly Asp Arg Leu Trp Glu Tyr Trp Asp 
325 330 335 

Arg Asp Glu Leu Arg Asp Glu Leu Phe Arg Tyr Ser Leu Asp Asp Val 
340 345 350 

Val Ala Thr His Arg lie Ala Glu Lys lie Leu Pro Leu Asn Leu Glu 
355 360 365 

Leu Thr Arg Leu Val Gly Gin Pro Leu Phe Asp He Ser Arg Met Ala 
370 375 380 

Thr Gly Gin Gin Ala Glu Trp Phe Leu Val Arg Lys Ala Tyr Gin Tyr 
385 390 395 400 

Gly Glu Leu Val Pro Asn Lys Pro Ser Gin Ser Asp Phe Ser Ser Arg 
405 410 415 

Arg Gly Arg Arg Ala Val Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly 
420 425 430 

Leu His Glu Asn lie Val Gin Phe Asp Phe Arg Ser Leu Tyr Pro Ser 
435 440 445 

lie lie lie Ser Lys Asn lie Ser Pro Asp Thr Leu Thr Asp Asp Glu 
450 455 460 

Glu Ser Glu Cys Tyr Val Ala Pro Glu Tyr Gly Tyr Arg Phe Arg Lys 
465 470 475 480 

Ser Pro Arg Gly Phe Val Pro Ser Val lie Gly Glu lie Leu Ser Glu 
485 490 495 

Arg Val Arg lie Lys Glu Glu Met Lys Gly Ser Asp Asp Pro Met Glu 
500 505 510 

Arg Lys He Leu Asn Val Gin Gin Glu Ala Leu Lys Arg Leu Ala Asn 
515 520 525 

Thr Met Tyr Gly Val Tyr Gly Tyr Ser Arg Phe Arg Trp Tyr Ser Met 
530 535 540 

Glu Cys Ala Glu Ala He Thr Ala Trp Gly Arg Asp Tyr He Lys Lys 
545 550 555 560 

Thr He Lys Thr Ala Glu Glu Phe Gly Phe His Thr Val Tyr Ala Asp 
565 570 575 
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Thr Asp Gly Phe Tyr Ala Thr Tyr Arg Gly 
580 585 

(2) ANGABEN ZU SEQ ID NO: 27: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1 143 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

Met Asp Ala Thr Leu Asp Arg Phe Phe Pro Leu Phe Glu Ser Glu Ser 
1 5 10 15 

Asn Glu Asp Phe Trp Arg lie Glu Glu He Arg Arg Tyr His Glu Ser 
20 25 30 

Leu Met Val Glu Leu Asp Arg lie Tyr Arg lie Ala Glu Ala Ala Arg 
35 40 45 

Lys Lys Gly Leu Asp Pro Glu Leu Ser Val Glu lie Pro lie Ala Lys 
50 55 60 

Asn Met Ala Glu Arg Val Glu Lys Leu Met Asn Leu Gin Gly Leu Ala 
65 70 75 80 

Lys Arg He Met Glu Leu Glu Glu Gly Gly Leu Ser Arg Glu Leu He 
85 90 95 

Cys Phe Lys Val Ala Asp Glu He Val Glu Gly Lys Phe Gly Glu Met 
100 105 110 

Pro Lys Glu Glu Ala He Asp Lys Ala Val Arg Thr Ala Val Ala lie 
115 120 125 

Met Thr Glu Gly Val Val Ala Ala Pro He Glu Gly lie Ala Arg Val 
130 135 140 
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Arg He Asp Arg Glu Asn Phe Leu Arg Val Tyr Tyr Ala Gly Pro He 
145 150 155 160 

Arg Ser Ala Gly Gly Thr Ala Gin Val lie Ser Val Leu Val Ala Asp 
165 170 175 

Tyr Val Arg Arg Lys Ala Glu He Gly Arg Tyr Val Pro Thr Glu Glu 
180 185 190 

Glu lie Leu Arg Tyr Cys Glu Glu He Pro Leu Tyr Lys Lys Val Ala 
195 " 200 205 

Asn Leu Gin Tyr Leu Pro Ser Asp Glu Glu lie Arg Leu lie Val Ser 
210 215 220 

Asn Cys Pro He Cys He Asp Gly Glu Pro Thr Glu Ser Ala Glu Val 
225 230 235 240 

Ser Gly Tyr Arg Asn Leu Pro Arg Val Glu Thr Asn Arg Val Arg Gly 
245 250 255 

Gly Met Ala Leu Val He Ala Glu Gly lie Ala Leu Lys Ala Pro Lys 
260 265 270 

Leu Lys Lys Met Val Asp Glu Val Gly lie Glu Gly Trp Glu Trp Leu 
275 280 285 

Asp Ala Leu lie Lys Gly Gly Gly Asp Ser Gly Ser Glu Glu Glu Lys 
290 295 300 

Ala Val He Lys Pro Lys Asp Lys Tyr Leu Ser Asp lie Val Ala Gly 
305 310 315 320 

Arg Pro Val Leu Ser His Pro Ser Arg Lys Gly Gly Phe Arg Leu Arg 
325 330 335 

Tyr Gly Arg Ala Arg Asn Ser Gly Phe Ala Thr Val Gly Val Asn Pro 
340 345 350 

Ala Thr Met Tyr Leu Leu Glu Phe Val Ala Val Gly Thr Gin Leu Lys 
355 360 365 

Val Glu Arg Pro Gly Lys Ala Gly Gly Val Val Pro Val Ser Thr He 
370 " 375 380 

Glu Gly Pro Thr Val Arg Leu Lys Asn Gly Asp Val Val Lys He Asn 
385 390 395 400 
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Thr Leu Ser Glu Ala Lys Ala Leu Lys Gly Glu Val Ala Ala lie Leu 
405 410 415 

5 Asp Leu Gly Glu lie Leu'lle Asn Tyr Gly Asp Phe Leu Glu Asn Asn 
420 425 430 

10 His Pro Leu lie Pro Ala Ser Tyr Thr Tyr Glu Trp Trp lie Gin Glu 
435 440 445 

Ala Glu Lys Ala Gly Leu Arg Gly Asp Tyr Arg Lys He Ser Glu Glu 
is 450 455 460 

Glu Ala Leu Lys Leu Cys Asp Glu Phe His Val Pro Leu His Pro Asp 
465 470 475 480 

20 

Tyr Thr Tyr Leu Trp His Asp He Ser Val Glu Asp Tyr Arg Tyr Leu 
485 490 495 

25 Arg Asn Phe Val Ser Asp Asn Gly Lys lie Glu Gly Lys His Gly Lys 
500 505 510 

Ser Val Leu Leu Leu Pro Tyr Asp Ser Arg Val Lys Glu He Leu Glu 
30 515 520 525 

Ala Leu Leu Leu Glu His Lys Val Arg Glu Ser Phe lie Val He Glu 
35 530 535 540 

Thr Trp Arg Ala Phe lie Arg Cys Leu Gly Leu Asp Glu Lys Leu Ser 
545 550 555 560 

40 

Lys Val Ser Glu Val Ser Gly Lys Asp Val Leu Glu He Val Asn Gly 
565 570 575 

45 He Ser Gly lie Lys Val Arg Pro Lys Ala Leu Ser Arg lie Gly Ala 
580 585 590 

Arg Met Gly Arg Pro Glu Lys Ala Lys Glu Arg Lys Met Ser Pro Pro 

50 " 595 600 605 

Pro His He Leu Phe Pro Val Gly Met Ala Gly Gly Asn Thr Arg Asp 
610 615 620 

55 

He Lys Asn Ala He Asn Tyr Thr Lys Ser Tyr Asn Ala Lys Lys Gly 
625 630 635 640 

60 Glu He Glu Val Glu He Ala lie Arg Lys Cys Pro Gin Cys Gly Lys 
645 650 655 
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Glu Thr Phe Trp Leu Lys Cys Asp Val Cys Gly Glu Leu Thr Glu Gin 
660 665 670 

Leu Tyr Tyr Cys Pro Ser Cys Arg Met Lys Asn Thr Ser Ser Val Cys 
675 680 685 

Glu Ser Cys Gly Arg Glu Cys Glu Gly Tyr Met Lys Arg Lys Val Asp 
690 695 700 

Leu Arg Glu Leu Tyr Glu Glu Ala lie Ala Asn Leu Gly Glu Tyr Asp 
705 710 715 720 

Ser Phe Asp Thr lie Lys Gly Val Lys Gly Met Thr Ser Lys Thr Lys 
725 730 735 

lie Pro Glu Arg Leu Glu Lys Gly He Leu Arg Val Lys His Gly Val 
740 745 750 

Phe Val Phe Lys Asp Gly Thr Ala Arg Phe Asp Ala Thr Asp Leu Pro 
755 760 765 

He Thr His Phe Lys Pro Ala Glu He Gly Val Ser Val Glu Lys Leu 
770 775 780 

Arg Glu Leu Gly Tyr Glu Arg Asp Tyr Lys Gly Ala Glu Leu Lys Asn 
785 790 795 800 

Glu Asn Gin lie Val Glu Leu Lys Pro Gin Asp Val He Leu Pro Lys 
805 810 815 

Ser Gly Ala Glu Tyr Leu Leu Arg Val Ala Asn Phe He Asp Asp Leu 
820 825 830 

Leu Val Lys Phe Tyr Lys Met Glu Pro Phe Tyr Asn Ala Lys Ser Val 
835 840 845 

Glu Asp Leu He Gly His Leu Val He Gly Leu Ala Pro His Thr Ser 
850 855 860 

Ala Gly Val Leu Gly Arg He lie Gly Phe Ser Asp Val Leu Ala Gly 
865 870 875 880 

Tyr Ala His Pro Tyr Phe His Ala Ala Lys Arg Arg Asn Cys Asp Gly 
885 890 895 

Asp Glu Asp Cys Phe Met Leu Leu Leu Asp Gly Leu Leu Asn Phe Ser 
900 905 910 
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Arg Lys Phe Leu Pro Asp Lys Arg Gly Gly Gin Met Asp Ala Pro Leu 
91 5 920 925 

Val Leu Thr Ala lie Val Asp Pro Arg Glu Val Asp Lys Glu Val His 
930 935 940 

Asn Met Asp lie Val Glu Arg Tyr Pro Leu Glu Phe Tyr Glu Ala Thr 
945 950 955 960 

Met Arg Phe Ala Ser Pro Lys Glu Met Glu Asp Tyr Val Glu Lys Val 
965 970 975 

Lys Asp Arg Leu Lys Asp Glu Ser Arg Phe Cys Gly Leu Phe Phe Thr 
980 985 990 

His Asp Thr Glu Asn lie Ala Ala Gly Val Lys Glu Ser Ala Tyr Lys 
995 1000 1005 

Ser Leu Lys Thr Met Gin Asp Lys Val Tyr Arg Gin Met Glu Leu Ala 
1010 1015 1020 

Arg Met He Val Ala Val Asp Glu His Asp Val Ala Glu Arg Val lie 
1025 1030 1035 1040 

Asn Val His Phe Leu Pro Asp He He Gly Asn Leu Arg Ala Phe Ser 
1045 1050 1055 

Arg Gin Glu Phe Arg Cys Thr Arg Cys Asn Thr Lys Tyr Arg Arg lie 
1060 1065 1070 

Pro Leu Val Gly Lys Cys Leu Lys Cys Gly Asn Lys Leu Thr Leu Thr 
1075 1080 1085 

Val His Ser Ser Ser He Met Lys Tyr Leu Glu Leu Ser Lys Phe Leu 
1090 1095 1100 

Cys Glu Asn Phe Asn Val Ser Ser Tyr Thr Lys Gin Arg Leu Met Leu 
1105 1110 1115 1120 

Leu Glu Gin Glu He Lys Ser Met Phe Glu Asn Gly Thr Glu Lys Gin 
1125 1130 1135 

Val Ser lie Ser Asp Phe Val 
1140 

(2) ANGABEN ZU SEQ ID NO: 28: 
(i) SEQUENZKENNZEICHEN: . 
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(A) LANGE: 1139 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Met lie Val Met Val His Val Ala Cys Ser Glu Asn Met Lys Lys Tyr 
15 10 15 

Phe Glu Asn lie Val Asp Glu Val Lys Lys lie Tyr Arg He Ala Glu 
20 25 30 

Glu Cys Arg Lys Lys Gly Phe Asp Pro Thr Asp Glu Val Glu lie Pro 
35 40 45 

Leu Ala Ala Asp Met Ala Asp Arg Val <$lu Gly Leu Val Gly Pro Lys 
50 55 60 

Gly Val Ala Glu Arg He Arg Glu Leu Val Lys Glu Leu Gly Lys Glu 
65 70 75 80 

Pro Ala Ala Leu Glu lie Ala Lys Glu lie Val Glu Gly Lys Phe Gly 
85 90 95 

Asn Phe Asp Lys Glu Lys Lys Ala Glu Gin Ala Val Arg Thr Ala Leu 
100 105 110 

Ala Val Leu Thr Glu Gly lie Val Ala Ala Pro Leu Glu Gly He Ala 
115 120 125 

Asp Val Lys lie Lys Lys Asn Pro Asp Gly Thr Glu Tyr Leu Ala He 
130 135 140 

Tyr Tyr Ala Gly Pro He Arg Ser Ala Gly Gly Thr Ala Gin Ala Leu 
145 150 155 160 

Ser Val Leu Val Gly Asp Phe Val Arg Lys Ala Met Gly Leu Asp Arg 
165 170 175 
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Tyr Lys Pro Thr Glu Asp Glu lie Glu Arg Tyr Val Glu Glu Val Glu 
180 185 190 

5 Leu Tyr Gin Ser Glu Val Gly Ser Phe Gin Tyr Asn Pro Thr Ala Asp 
195 200 205 

10 Glu lie Arg Thr Ala lie Arg Asn lie Pro lie Glu lie Thr Gly Glu 
210 215 220 

Ala Thr Asp Asp Val Glu Val Ser Gly His Arg Asp Lieu Pro Arg Val 
,s 225 230 235 240 

Glu Thr Asn Gin Leu Arg Gly Gly Ala Leu Leu Val Leu Val Glu Gly 
245 250 255 

20 

Val Leu Leu Lys Ala Pro Lys lie Leu Arg His Val Asp Lys Leu Gly 
260 265 270 

25 He Glu Gly Trp Asp Trp Leu Lys Asp Leu Met Ser Lys Lys Glu Glu 
275 280 285 

Lys Glu Glu Glu Lys Asp Glu Lys Val Asp Asp Glu. Glu He Asp Glu 
30 290 295 300 

Glu Glu Glu Glu He Ser Gly Tyr Trp Arg Asp Val Lys lie Glu Ala 
35 305 310 315 320 

Asn Lys Lys Phe He Ser Glu Val lie Ala Gly Arg Pro Val Phe Ala 
325 330 335 

40 

His Pro Ser Lys Val Gly Gly Phe Arg Leu Arg Tyr Gly Arg Ser Arg 
340 345 350 

« Asn Thr Gly Phe Ala Thr Gin Gly Phe His Pro Ala Leu Met Tyr Leu 
355 360 365 

Val Asp Glu Phe Met Ala Val Gly Thr Gin Leu Lys Thr Glu Arg Pro 
50 370 375 380 

Gly Lys Ala Thr Cys Val Val Pro Val Asp Ser He Glu Pro Pro lie 
385 390 395 400 

55 

Val Lys Leu Lys Asn Gly Asp Val He Arg Val Asp Thr He Glu Lys 
405 410 415 

Ala Met Asp Val Arg Asn Arg Val Glu Glu lie Leu Phe Leu Gly Asp 
420 425 430 
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Val Leu Val Asn Tyr Gly Asp Phe Leu Glu Asn Asn His Pro Leu Leu 
435 440 445 

Pro Ser Cys Trp Cys Glu Glu Trp Tyr Glu Lys He Leu lie Ala Asn 
450 455 460 

Asn lie Glu Tyr Asp Lys Asp Phe lie Lys Asn Pro Lys Pro Glu Glu 
465 '470 475 480 

Ala Val Lys Phe Ala Leu Glu Thr Lys Thr Pro Leu His Pro Arg Phe 
485 490 495 

Thr Tyr His Trp His Asp Val Ser Lys Glu Asp He He Leu Leu Arg 
500 505 510 

Asn Trp Leu Leu Lys Gly Lys Glu Asp Ser Leu Glu Gly Lys Lys Val 
515 520 525 

Trp He Val Asp Leu Glu He Glu Glu Asp Lys Lys Ala Lys Arg He 
530 535 540 

Leu Glu Leu lie Gly Cys Cys His Leu Val Arg Asn Lys Lys Val He 
545 550 555 560 

lie Glu Glu Tyr Tyr Pro Leu Leu Tyr Ser Leu Gly Phe Asp Val Glu 
565 570 575 

Asn Lys Lys Asp Leu Val Glu Asn He Glu Lys He Leu Glu Ser Ala 
580 585 590 

Lys Asn Ser Met His Leu He Asn Leu Leu Ala Pro Phe Glu Val Arg 
595 600 605 

Arg Asn Thr Tyr Val Tyr Val Gly Ala Arg Met Gly Arg Pro Glu Lys 
610 615 620 

Ala Ala Pro Arg Lys Met Lys Pro Pro Val Asn Gly Leu Phe Pro He 
625 630 635 640 

Gly Asn Ala Gly Gly Gin Val Arg Leu He Asn Lys Ala Val Glu Glu 
645 650 655 

Asn Asn Thr Asp Asp Val Asp Val Ser Tyr Thr Arg Cys Pro Asn Cys 
660 665 670 

Gly Lys He Ser Leu Tyr Arg Val Cys Pro Phe Cys Gly Thr Lys Val 
675 680 685 
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Glu Leu Asp Asn Phe Gly Arg lie Lys Ala Pro Leu Lys Asp Tyr Trp 
690 695 700 

5 Tyr Ala Ala Leu Lys Arg Leu Gly lie Asn Lys Pro Gly Asp Val Lys 
705 710 715 720 

10 Cys lie Lys Gly Met Thr Ser Lys Gin Lys lie Val Glu Pro Leu Glu 
725 730 735 

Lys Ala lie Leu Arg Ala lie Asn Glu Val Tyr Val Phe Lys Asp Gly 
1S 740 745 750 

Thr Thr Arg Phe Asp Cys Thr Asp Val Pro Val Thr His Phe Lys Pro 
755 760 765 

20 

Asn Glu He Asn Val Thr Val Glu Lys Leu Arg Glu Leu Gly Tyr Asp 
770 775 780 

25 Lys Asp He Tyr Gly Asn Glu Leu Val Asp Gly Glu Gin Val Val Glu 
785 790 795 800 

Leu Lys Pro Gin Asp Val He lie Pro Glu Ser Cys Ala Glu Tyr Phe 
30 805 810 815 

Val Lys Val Ala Asn Phe He Asp Asp Leu Leu Glu Lys Phe Tyr Lys 
35 820 825 830 

Val Glu Arg Phe Tyr Asn Val Lys Lys Lys Glu Asp Leu He Gly His 
835 840 845 

40 

Leu Val He Gly Met Ala Pro His Thr Ser Ala Gly Met Val Gly Arg 
850 855 860 

4s He He Gly Tyr Thr Lys Ala Asn Val Gly Tyr Ala His Pro Tyr Phe 
865 870 875 880 

His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Phe Phe 
so 885 890 895 

Leu Leu Leu Asp Ala Phe Leu Asn Phe Ser Lys Lys Phe Leu Pro Asp 
900 905 910 

55 

Lys Arg Gly Gly Gin Met Asp Ala Pro Leu Val Leu Thr Thr He Leu 
915 920 925 

60 Asp Pro Lys Glu Val Asp Gly Glu Val His Asn Met Asp Thr Met Trp 
930 935 940 
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Ser Tyr Pro Leu Glu Phe Tyr Glu Lys Thr Leu Glu Met Pro Ser Pro 
945 950 955 960 

Lys Glu Val Lys Glu Phe Met Glu Thr Val Glu Asp Arg Leu Gly Lys 
965 970 975 

Pro Glu Gin Tyr Glu Gly He Gly Tyr Thr His Glu Thr Ser Arg lie 
980 985 990 

Asp Leu Gly Pro Lys Val Cys Ala Tyr Lys Thr Leu Gly Ser Met Leu 
995 1000 1005 

Glu Lys Thr Thr Ser Gin Leu Ser Val Ala Lys Lys lie Arg Ala Thr 
1010 1015 1020 

Asp Glu Arg Asp Val Ala Glu Lys Val lie Gin Ser His Phe lie Pro 
1025 1030 1035 1040 

Asp Leu He Gly Asn Leu Arg Ala Phe Ser Arg Gin Ala Val Arg Cys 
1045 1050 1055 

Lys Cys Gly Ala Lys Tyr Arg Arg He Pro Leu Lys Gly Lys Cys Pro 
1060 1065 1070 

Lys Cys Gly Ser Asn Leu lie Leu Thr Val Ser Lys Gly Ala Val Glu 
1075 1080 1085 

Lys Tyr Met Asp Val Ala Glu Lys Met Ala Glu Glu Tyr Asn Val Asn 
1090 1095 1100 

Asp Tyr He Lys Gin Arg Leu Lys He lie Lys Glu Gly He Asn Ser 
1105 1110 1115 1120 

lie Phe Glu Asn Glu Lys Ser Arg Gin Val Lys Leu Ser Asp Phe Phe 
1125 1130 1135 

Lys He Gly 



(2) ANGABEN ZU SEQ ID NO: 29: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1434 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

Met Val Leu Met Glu Leu Pro Lys Glu Met Glu Glu Tyr Phe Ser Met 
15 10 15 

Leu Gin Arg Glu lie Asp Lys Ala Tyr Glu He Ala Lys Lys Ala Arg 
20 25 30 

Ala Gin Gly Lys Asp Pro Ser Leu Asp Val Glu He Pro Gin Ala Ser 
35 40 45 

Asp Met Ala Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val Ala 
50 55 60 

Glu Arg He Arg Glu Leu Val Lys Glu Tyr Gly Lys Glu He Ala Ala 
65 " 70 75 80 

Leu Lys lie Val Asp Glu lie lie Asp Gly Lys Phe Gly Asp Leu Gly 
85 90 95 

Ser Lys Glu Lys Tyr Ala Glu Gin Ala Val Arg Thr Ala Leu Ala lie 
100 105 110 

Leu Thr Glu Gly Val Val Ser Ala Pro lie Glu Gly He Ala Ser Val 
115 120 125 

Lys lie Lys Arg Asn Thr Trp Ser Asp Asn Ser Glu Tyr Leu Ala Leu 
130 135 140 

Tyr Tyr Ala Gly Pro lie Arg Ser Ser Gly Gly Thr Ala Gin Ala Leu 
145 150 155 160 

Ser Val Leu Val Gly Asp Tyr Val Arg Arg Lys Leu Gly Leu Asp Arg 
165 170 175 

Phe Lys Pro Ser Glu Lys His He Glu Arg Met Val Glu Glu Val Asp 
180 185 190 

Leu Tyr His Arg Thr Val Ser Arg Leu Gin Tyr His Pro Ser Pro Glu 
1 95 200 205 

Glu Val Arg Leu Ala Met Arg Asn He Pro He Glu lie Thr Gly Glu 
210 215 220 
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Ala Thr Asp Glu Val Glu Val Ser His Arg Asp lie Pro Gly Val Glu 
225 230 235 240 

thr Asn Gin Leu Arg Gly Gly Ala He Leu Val Leu Ala Glu Gly Val 
245 250 255 

Leu Gin Lys Ala Lys Lys Leu Val Lys Tyr He Asp Lys Met Gly He 
260 265 270 

Glu Gly Trp Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly 
275 280 285 

Glu Glu lie Glu. Glu Glu Gly Ser Ala Glu Ser Thr Val Glu Glu Thr 
290 295 300 

Lys Val Glu Val Asp Met Gly Phe Tyr Tyr Ser Leu Tyr Gin Lys Phe 
305 310 315 320 

Lys Ser Glu He Ala Pro Asn Asp Lys Tyr Ala Lys Glu He He Gly 
325 330 335 

Gly Arg Pro Leu Phe Ser Asp Pro Ser Arg Asn Gly Gly Phe Arg Leu 
340 345 350 

Arg Tyr Gly Arg Ser Arg Val Ser Gly Phe Ala Thr Trp Gly He Asn 
355 360 365 

Pro Ala Thr Met lie Leu Val Asp Glu Phe Leu Ala He Gly Thr Gin 
370 375 380 

Leu Lys Thr Glu Arg Pro Gly Lys Gly Ala Val Val Thr Pro Val Thr 
385 390 395 400 

Thr lie Glu Gly Pro lie Val Lys Leu Lys Asp Gly Ser Val Val Lys 
405 410 415 

Val Asp Asp Tyr Lys Leu Ala Leu Lys lie Arg Asp Glu Val Glu Glu 
420 425 430 

lie Leu Tyr Leu Gly Asp Ala Val lie Ala Phe Gly Asp Phe Val Glu 
435 440 445 

Asn Asn Gin Thr Leu Leu Pro Ala Asn Tyr Cys Glu Glu Trp Trp He 
450 455 460 

Leu Glu Phe Thr Lys Ala Leu Asn Glu He Tyr Glu Val Glu Leu Lys 
465 470 475 480 
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Pro Phe Glu Val Asn Ser Ser Glu Asp Leu Glu Glu Ala Ala Asp Tyr 
485 490 495 

5 Leu Glu Val Asp lie Glu Phe Leu Lys Glu Leu Leu Lys Asp Pro Leu 
500 505 510 

10 Arg Thr Lys Pro Pro Val Glu Leu Ala He His Phe Ser Glu lie Leu 
515 520 525 

Gly He Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Ser Val Lys 
,s 530 535 540 

Pro G1u Gin Val Glu Lys Leu Trp Arg Val Leu Lys Glu His Ala His 
545 550 555 560 

20 

He Asp Trp Asp Asn Phe Arg Gly lie Lys Phe Ala Arg Arg He Val 
565 570 575 

25 He Pro Leu Glu Lys Leu Arg Asp Ser Lys Arg Ala Leu Glu Leu Leu 
580 585 590 

Gly Leu Pro His Lys Val Glu Gly Lys Asn Val He Val Asp Tyr Pro 
i0 595 600 605 

Trp Ala Ala Ala Leu Leu Thr Pro Leu Gly Asn Leu Glu Trp Glu Phe 
3J 610 615 620 

Arg Ala Lys Pro Leu His Thr Thr lie Asp He He Asn Glu Asn Asn 
625 630 635 640 

40 

Glu lie Lys Leu Arg Asp Arg Gly He Ser Trp He Gly Ala Arg Met 
645 650 655 

« Gfy Arg Pro Glu Lys Ala Lys Glu Arg Lys Met Lys Pro Pro Val Gin 
660 665 670 

Val Leu Phe Pro He Gly Leu Ala Gly Gly Ser Ser Arg Asp lie Lys 
50 675 680 685 

Lys Ala Ala Glu Glu Gly Lys Val Ala Glu Val Glu He Ala Leu Phe 
690 695 700 

55 

Lys Cys Pro Lys Cys Gly His Val Gly Pro Glu His He Cys Pro Asn 
705 710 715 720 

60 Cys Gly Thr Arg Lys Glu Leu He Trp Val Cys Pro Arg Cys Asn Ala 
725 730 735 
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Glu Tyr Pro Glu Ser Gin Ala Ser Gly Tyr Asn Tyr Thr Cys Pro Lys 
740 745 750 

Cys Asn Val Lys Leu Lys Pro Tyr Ala Lys Arg Lys lie Lys Pro Ser 
755 760 765 

Glu Leu Leu Lys Arg Ala Met Asp Asn Val Lys Val Tyr Gly He Asp 
770 775 780 

Lys Leu Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys Met Pro Glu 
785 790 795 800 

Pro Leu Glu Lys Gly Leu Leu Arg Ala Lys Asn Asp Val Tyr Val Phe 
805 810 815 

Lys Asp Gly Thr He Arg Phe Asp Ala Thr Asp Ala Pro He Thr His 
820 825 830 

Phe Arg Pro Arg Glu He Gly Val Ser Val Glu Lys Leu Arg Glu Leu 
835 840 845 

Gly Tyr Thr His Asp Phe Glu Gly Asn Pro Leu Val Ser Glu Asp Gin 
850 855 860 

lie Val Glu Leu Lys Pro Gin Asp He He Leu Ser Lys Glu Ala Gly 
865 870 875 880 

Lys Tyr Leu Leu Lys Val Ala Lys Phe Val Asp Asp Leu Leu Glu Lys 
885 890 895 

Phe Tyr Gly Leu Pro Arg Phe Tyr Asn Ala Glu Lys Met Glu Asp Leu 
900 905 910 

He Gly His Leu Val lie Gly Leu Ala Pro His Thr Ser Ala Gly lie 
915 920 925 

Val Gly Arg He He Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His 
930 935 940 

Pro Tyr Phe His Ala Ala Lys Arg Arg Asn Cys Phe Pro Gly Asp Thr 
945 950 955 960 

Arg lie Leu Val Gin He Asn Gly Thr Pro Gin Arg Val Thr Leu Lys 
965 970 975 

Glu Leu Tyr Glu Leu Phe Asp Glu Glu His Tyr Glu Ser Met Val Tyr 
980 985 990 
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Val Arg Lys Lys Pro Lys Val Asp He Lys Val Tyr Ser Phe Asn Pro 
995 1000 1005 

s Glu Glu Gly Lys Val Val Leu Thr Asp He Glu Glu Val He Lys Ala 
1010 1015 1020 

Pro Ala Thr Asp His Leu lie Arg Phe Glu Leu Glu Leu Gly Ser Ser 
1025 1030 1035 1040 

Phe Glu Thr Thr Val Asp His Pro Val Leu Val Tyr Glu Asn Gly Lys 
1S 1045 1050 1055 

Phe Val Glu Lys Arg Ala Phe Glu Val Arg Glu Gly Asn lie He He 
1060 1065 1070 

20 

He He Asp Glu Ser Thr Leu Glu Pro Leu Lys Val Ala Val Lys Lys 
1075 1080 1085 

25 He Glu Phe lie Glu Pro Pro Glu Asp Phe Val Phe Ser Leu Asn Ala 
1090 1095 1100 

Lys Lys Tyr His Thr Val lie lie Asn Glu Asn lie Val Thr His Gin 
30 1105 1110 1115 1120 

Cys Asp Gly Asp Glu Asp Ala Val Met Leu Leu Leu Asp Ala Leu Leu 
1125 1130 1135 

Asn Phe Ser Arg Tyr Tyr Leu Pro Glu Lys Arg Gly Gly Lys Met Asp 
1140 1145 1150 

40 

Ala Pro Leu Val lie Thr Thr Arg Leu Asp Pro Arg Glu Val Asp Ser 
1155 1160 1165 

45 Glu Val His Asn Met Asp He Val Arg Tyr Tyr Pro Leu Glu Phe Tyr 
1170 1175 1180 

Glu Ala Thr Tyr Glu Leu Lys Ser Pro Lys Glu Leu Val Gly Val He 
so H85 1190 1195 1200 

Glu Arg Val Glu Asp Arg Leu Gly Lys Pro Glu Met Tyr Tyr Gly Leu 
1205 1210 1215 

55 

Lys Phe Thr His Asp Thr Asp Asp He Ala Leu Gly Pro Lys Met Ser 
1220 1225 1230 

60 Leu Tyr Lys Gin Leu Gly Asp Met Glu Glu Lys Val Lys Arg Gin Leu 
1235 1240 1245 
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Asp Val Ala Arg Arg lie Arg Ala Val Asp Glu His Lys Val Ala Glu 
1250 1255 1260 

Thr lie Leu Asn Ser His Leu He Pro Asp Leu Arg Gly Asn Leu Arg 
1265 1270 1275 1280 

Ser Phe Thr Arg Gin Glu Phe Arg Cys Val Lys Cys Asn Thr Lys Phe 
1285 1290 1295 

Arg Arg Pro Pro Leu Asp Gly Lys Cys Pro lie Cys Gly Gly Lys He 
1300 1305 1310 

Val Leu Thr Val Ser Lys Gly Ala He Glu Lys Tyr Leu Gly Thr Ala 
1315 1320 1325 

Lys Met Leu Val Thr Glu Tyr Lys Val Lys Asn Tyr Thr Arg Gin Arg 
1330 1335 1340 

He Cys Leu Thr Glu Arg Asp He Asp Ser Leu Phe Glu Thr Val Phe 
1345 1350 1355 1360 

Pro Glu Thr Gin Leu Thr Leu Leu Val Asn Pro Asn Asp lie Cys Gin 
1365 , 1370 1375 

Arg He He Met Glu Arg Thr Gly Gly Ser Lys Lys Ser Gly Leu Leu 
1380 1385 1390 

Glu Asn Phe Ala Asn Gly Tyr Asn Lys Gly Lys Lys Glu Glu Met Pro 
1395 1400 1405 

Lys Lys Gin Arg Lys Lys Glu Gin Glu Lys Ser Lys Lys Arg Lys Val 
1410 1415 1420 

He Ser Leu Asp Asp Phe Phe Ser Arg Lys 
1425 1430 

(2) ANGABEN ZU SEQ ID NO: 30: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1092 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 

Met Met Asp Tyr Phe Asn Glu Leu Glu Arg Glu Thr Glu Arg Leu Tyr 
5 1 5 10 15 



10 



Glu He Ala Arg Lys Ala Arg Ala Arg Gly Leu Asp Val Ser Thr Thr 
20 25 30 

Pro Glu lie Pro Leu Ala Lys Asp Leu Ala Glu Arg Val Glu Gly Leu 
35 40 45 

15 

Val Gly Pro Glu Gly lie Ala Arg Arg lie Lys Glu Leu Glu Gly Asp 
50 55 60 

20 Arg Gly Arg Glu Glu Val Ala Phe Gin lie Ala Ala Glu He Ala Ser 
65 70 75 80 

Gin Ala Val Pro Asp Asp Asp Pro Glu Glu Arg Glu Lys Leu Ala Asp 
25 85 90 95 

Gin Ala Leu Arg Thr Ala Leu Ala He Leu Thr Glu Gly Val Val Ala 
100 ~ 105 110 

30 

Ala Pro Leu Glu Gly lie Ala Arg Val Arg He Lys Glu Asn Phe Asp 
115 120 " 125 

35 

Lys Ser Arg Tyr Leu Ala Val Tyr Phe Ala Gly Pro He Arg Ser Ala 
130 135 140 

40 Gly Gly Thr Ala Ala Ala Leu Ser Val Leu He Ala Asp Tyr He Arg 
145 150 155 160 

Leu Ala Val Gly Leu Asp Arg Tyr Lys Pro Val Glu Arg Glu lie Glu 
4s 165 170 175 

Arg Tyr Val Glu Glu Val Glu Leu Tyr Glu Ser Glu Val Thr Asn Leu 
180 185 190 

50 

Gin Tyr Ser Pro Lys Pro Asp Glu Val Arg Leu Ala Ala Ser Lys He 
195 200 205 

55 Pro Val Glu Val Thr Gly Glu Pro Thr Asp Lys Val Glu Val Ser His 
210 215 220 

Arg Asp Leu Glu Arg Val Glu Thr Asn Asn lie Arg Gly Gly Ala Leu 
° 225 230 235 240 
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Leu Ala Met Val Glu Gly Val lie Gin Lys Ala Pro Lys Val Leu Lys 
245 250 255 

Tyr Ala Lys Gin Leu Lys Leu Glu Gly Trp Asp Trp Leu Glu Lys Phe 
260 265 270 

Ser Lys Ala Pro Lys Lys Gly Glu Gly Glu Glu Lys Val Val Val Lys 
275 280 285 

Ala Asp Ser Lys Tyr Val Glu Asp lie He Gly Gly Arg Pro Val Leu 
290 295 300 

Ala Tyr Pro Ser Glu Lys Gly Ala Phe Arg Leu Arg Tyr Gly Arg Ala 
305 310 315 320 

Arg Asn Thr Gly Leu Ala Ala Met Gly Val His Pro Ala Thr Met Glu 
325 330 335 

Leu Leu Gin Phe Leu Ala Val Gly Thr Gin Met Lys He Glu Arg Pro 
340 345 350 

Gly Lys Gly Asn Cys Val Val Pro Val Asp Thr lie Asp Gly Pro Val 
355 360 365 

Val Lys Leu Arg Asn Gly Asp Val He Arg lie Glu Asp Ala Glu Thr 
370 375 380 

Ala Ser Arg Val Arg Ser Glu Val Glu Glu He Leu Phe Leu Gly Asp 
385 390 395 400 

Met Leu Val Ala Phe Gly Glu Phe Leu Arg Asn Asn His Val Leu Met 
405 410 415 

Pro Ala Gly Trp Cys Glu Glu Trp Trp He Gin Thr He Leu Ser Ser 
420 425 430 

Pro Lys Tyr Pro Gly Asp Asp Pro Leu Asn Leu Ser Tyr Tyr Arg Thr 
435 440 445 

Arg Trp Asn Glu Leu Glu Val Ser Ala Gly Asp Ala Phe Arg lie Ser 
450 455 460 

Glu Glu Tyr Asp Val Pro Leu His Pro Arg Tyr Thr Tyr Phe Tyr His 
465 470 475 480 

Asp Val Thr Val Arg Glu Leu Asn Met Leu Arg Glu Trp Leu Asn Thr 
485 490 495 
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Ser Gin Leu Glu Asp Glu Leu Val Leu Glu Leu Arg Pro Glu Lys Arg 
500 505 510 

s lie Leu Glu lie Leu Gly Val Pro His Arg Val Lys Asp Ser Arg Val 
515 520 525 

10 Val lie Gly His Asp Asp Ala His Ala Leu He Lys Thr Leu Arg Lys 
530 535 540 

Pro Leu Glu Asp Ser Ser Asp Thr Val Glu Ala Leu Asn Arg Val Ser 
is 545 550 555 560 

Pro Val Arg He Met Lys Lys Ala Pro Thr Tyr lie Gly Thr Arg Val 
565 570 575 

20 

Gly Arg Pro Glu Lys Thr Lys Glu Arg Lys Met Arg Pro Ala Pro His 
580 585 590 

25 Val Leu Phe Pro He Gly Lys Tyr Gly Gly Ser Arg Arg Asn He Pro 
595 600 605 

Asp Ala Ala Lys Lys Gly Ser lie Thr Val Glu He Gly Arg Ala Thr 
i0 610 615 620 

Cys Pro Ser Cys Arg Val Ser Ser Met Gin Ser He Cys Pro Ser Cys 
35 625 630 635 640 

Gly Ser Arg Thr Val He Gly Glu Pro Gly Lys Arg Asn lie Asn Leu 
645 650 655 

40 

Ala Ala Leu Leu Lys Arg Ala Ala Glu Asn Val Ser Val Arg Lys Leu 
660 665 670 

4s Asp Glu He Lys Gly Val Glu Gly Met lie Ser Ala Glu Lys Phe Pro 
675 680 685 

Glu Pro Leu Glu Lys Gly He Leu Arg Ala Lys Asn Asp Val Tyr Thr 

so 690 695 o 700 

Phe Lys Asp Ala Thr He Arg His Asp Ser Thr Asp Leu Pro Leu Thr 
705 710 715 720 

55 

His Phe Thr Pro Arg Glu Val Gly Val Ser Val Glu Arg Leu Arg Glu 
725 730 735 

60 Leu Gly Tyr Thr Arg Asp Cys Tyr Gly Asp Glu Leu Glu Asp Glu Asp 
740 745 750 
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Gin lie Leu Glu Leu Arg Val Gin Asp Val Val lie Ser Glu Asp Cys 
755 760 765 

Ala Asp Tyr Leu Val Arg Val Ala Asn Phe Val Asp Asp Leu Leu Glu 
770 775 780 

Arg Phe Tyr Asp Leu Glu Arg Phe Tyr Asn Val Lys Thr Arg Glu Asp 
785 790 795 800 

Leu Val Gly His Leu He Ala Gly Leu Ala Pro His Thr Ser Ala Ala 
805 810 815 

Val Leu Gly Arg lie He Gly Phe Thr Gly Ala Ser Ala Cys Tyr Ala 
820 825 830 

His Pro Tyr Phe His Ser Ala Lys Arg Arg Asn Cys Asp Ser Asp Glu 
835 840 845 

Asp Ser Val Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Lys Ser 
850 855 860 

Tyr Leu Pro Ser Ser Arg Gly Gly Ser Met Asp Ala Pro Leu Val Leu 
865 870 875 880 

Ser Thr Arg He Asp Pro Glu Glu He Asp Asp Glu Ser His Asn He 
885 890 895 

Asp Thr Met Asp Met He Pro Leu Glu Val Tyr Glu Arg Ser Phe Asp 
900 905 910 

His Pro Arg Pro Ser Glu Val Leu Asp Val lie Asp Asn Val Glu Lys 
915 920 925 

Arg Leu Gly Lys Pro Glu Gin Tyr Thr Gly Leu Met Phe Ser His Asn 
930 935 940 

Thr Ser Arg He Asp Glu Gly Pro Lys Val Cys Leu Tyr Lys Leu Leu 
945 950 955 960 

Pro Thr Met Lys Glu Lys Val Glu Ser Gin He Thr Leu Ala Glu Lys 
965 970 975 

He Arg Ala Val Asp Gin Arg Ser Val Val Glu Gly Val Leu Met Ser 
980 985 990 

His Phe Leu Pro Asp Met Met Gly Asn He Arg Ala Phe Ser Arg Gin 
995 1000 1005 
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Lys Val Arg Cys Thr Lys Cys Asn Arg Lys Tyr Arg Arg lie Pro Leu 
1010 1015 1020 

Ser Gly Glu Cys Arg Cys Gly Gly Asn Leu Val Leu Thr Val Ser Lys 
1025 1030 1035 1040 

Gly Ser Val lie Lys Tyr Leu Glu He Ser Lys Glu Leu Ala Ser Arg 
1045 1050 1055 

Tyr Pro lie Asp Pro Tyr Leu Met Gin Arg lie Glu He Leu Glu Tyr 
1060 1065 1070 

Gly Val Asn Ser Leu Phe Glu Ser Asp Arg Ser Lys Gin Ser Ser Leu 
1075 1080 1085 

Asp Val Phe Leu 
1090 

(2) ANGABEN ZU SEQ ID NO: 31: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1263 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus furiosus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 

Met Glu Leu Pro Lys Glu He Glu Glu Tyr Phe Glu Met Leu Gin Arg 
1 5 10 15 

Glu He Asp Lys Ala Tyr Glu He Ala Lys Lys Ala Arg Ser Gin Gly 
20 25 30 

Lys Asp Pro Ser Thr Asp Val Glu He Pro Gin Ala Thr Asp Met Ala 
35 40 45 

Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val Ala Gin Arg He 
50 55 60 
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Arg Glu Leu Leu Lys Glu Tyr Asp Lys Glu lie Val Ala Leu Lys lie 
65 70 75 80 

Val Asp Glu lie He Glu Gly Lys Phe Gly Asp Phe Gly Ser Lys Glu 
85 90 95 

Lys Tyr Ala Glu Gin Ala Val Arg Thr Ala Leu Ala lie Leu Thr Glu 
100 105 110 

Gly lie Val Ser Ala Pro Leu Glu Gly lie Ala Asp Val Lys lie Lys 
115 120 125 

Arg Asn Thr Trp Ala Asp Asn Ser Glu Tyr Leu Ala Leu Tyr Tyr Ala 
130 135 140 

Gly Pro He Arg Ser Ser Gly Gly Thr Ala Gin Ala Leu Ser Val Leu 
145 150 155 160 

Val Gly Asp Tyr Val Arg Arg Lys Leu Gly Leu Asp Arg Phe Lys Pro 
165 170 175 

Ser Gly Lys His lie Glu Arg Met Val Glu Glu Val Asp Leu Tyr His 
180 185 190 

Arg Ala Val Ser Arg Leu Gin Tyr His Pro Ser Pro Asp Glu Val Arg 
1 95 200 205 

Leu Ala Met Arg Asn lie Pro He Glu He Thr Gly Glu Ala Thr Asp 
210 215 ' 220 

Asp Val Glu Val Ser His Arg Asp Val Glu Gly Val Glu Thr Asn Gin 
225 230 235 240 

Leu Arg Gly Gly Ala lie Leu Val Leu Ala Glu Gly Val Leu Gin Lys 
245 250 255 

Ala Lys Lys Leu Val Lys Tyr He Asp Lys Met Gly He Asp Gly Trp 
260 265 270 

Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly Glu Glu He 
275 280 285 

Glu Glu Ser Glu Ser Lys Ala Glu Glu Ser Lys Val Glu Thr Arg Val 
290 295 300 

Glu Val Glu Lys Gly Phe Tyr Tyr Lys Leu Tyr Glu Lys Phe Arg Ala 
305 310 315 320 
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Glu lie Ala Pro Ser Glu Lys Tyr Ala Lys Glu He He Gly Gly Arg 
325 330 335 

S Pro Leu Phe Ala Gly Pro Ser Glu Asn Gly Gly Phe Arg Leu Arg Tyr 
340 345 350 

10 Gly Arg Ser Arg Val Ser Gly Phe Ala Thr Trp Ser He Asn Pro Ala 
355 360 365 

Thr Met Val Leu Val Asp Glu Phe Leu Ala He Gly Thr Gin Met Lys 
is 370 375 380 

Thr Glu Arg Pro Gly Lys Gly Ala Val Val Thr Pro Ala Thr Thr Ala 
385 390 395 400 

20 

Glu Gly Pro lie Val Lys Leu Lys Asp Gly Ser Val Val Arg Val Asp 
405 410 415 

25 Asp Tyr Asn Leu Ala Leu Lys He Arg Asp Glu Val Glu Glu He Leu 
420 425 430 

Tyr Leu Gly Asp Ala lie He Ala Phe Gly Asp Phe Val Glu Asn Asn 
i0 435 440 445 

Gin Thr Leu Leu Pro Ala Asn Tyr Val Glu Glu Trp Trp He Gin Glu 
35 450 455 460 

Phe Val Lys Ala Val Asn Glu Ala Tyr Glu Val Glu Leu Arg Pro Phe 
465 470 475 480 

40 

Glu Glu Asn Pro Arg Glu Ser Val Glu Glu Ala Ala Glu Tyr Leu Glu 
485 490 495 

45 Val Asp Pro Glu Phe Leu Ala Lys Met Leu Tyr Asp Pro Leu Arg Val 
500 505 510 

Lys Pro Pro Val Glu Leu Ala He His Phe Ser Glu He Leu Glu He 
50 . 515 520 525 

Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Thr Val Asn Pro Lys 
530 535 540 

55 

Asp Val Glu Arg Leu Trp Gly Val Leu Lys Asp Lys Ala Thr He Glu 
545 550 555 560 

60 

Trp Gly Thr Phe Arg Gly lie Lys Phe Ala Lys Lys lie Glu lie Ser 
565 570 575 
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Leu Asp Asp Leu Gly Ser Leu Lys Arg Thr Leu Glu Leu Leu Gly Leu 
580 585 590 

Pro His Thr Val Arg Glu Gly lie Val Val Val Asp Tyr Pro Trp Ser 
595 600 605 

Ala Ala Leu Leu Thr Pro Leu Gly Asn Leu Glu Trp Glu Phe Lys Ala 
610 615 620 

Lys Pro Phe Tyr Thr Val He Asp He He Asn Glu Asn Asn Gin He 
625 630 635 640 

Lys Leu Arg Asp Arg Gly He Ser Trp lie Gly Ala Arg Met Gly Arg 
645 650 655 

Pro Glu Lys Ala Lys Glu Arg Lys Met Lys Pro Pro Val Gin Val Leu 
660 665 670 

Phe Pro He Gly Leu Ala Gly Gly Ser Ser Arg Asp He Lys Lys Ala 
675 680 685 

Ala Glu Glu Gly Lys He Ala Glu Val Glu He Ala Phe Phe Lys Cys 
690 695 700 

Pro Lys Cys Gly His Val Gly Pro Glu Thr Leu Cys Pro Glu Cys Gly 
705 710 715 720 

He Arg Lys Glu Leu He Trp Thr Cys Pro Lys Cys Gly Ala Glu Tyr 
725 730 735 

Thr Asn Ser Gin Ala Glu Gly Tyr Ser Tyr Ser Cys Pro Lys Cys Asn 
740 745 750 

Val Lys Leu Lys Pro Phe Thr Lys Arg Lys He Lys Pro Ser Glu Leu 
755 760 765 

Leu Asn Arg Ala Met Glu Asn Val Lys Val Tyr Gly Val Asp Lys Leu 
770 775 780 

Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys lie Ala Glu Pro Leu 
785 790 795 800 

Glu Lys Gly Leu Leu Arg Ala Lys Asn Glu Val Tyr Val Phe Lys Asp 
805 810 815 

Gly Thr He Arg Phe Asp Ala Thr Asp Ala Pro He Thr His Phe Arg 
820 825 830 
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Pro Arg Glu He Gly Val Ser Val Glu Lys Leu Arg Glu Leu Gly Tyr 
835 840 845 

Thr His Asp Phe Glu Gly Lys Pro Leu Val Ser Glu Asp Gin lie Val 
850 855 860 

Glu Leu Lys Pro Gin Asp Val lie Leu Ser Lys Glu Ala Gly Lys Tyr 
865 870 875 880 

Leu Leu Arg Val Ala Arg Phe Val Asp Asp Leu Leu Glu Lys Phe Tyr 
885 890 895 

Gly Leu Pro Arg Phe Tyr Asn Ala Glu Lys Met Glu Asp Leu He Gly 
900 ~ 905 910 

His Leu Val He Gly Leu Ala Pro His Thr Ser Ala Gly He Val Gly 
915 920 925 

Arg He He Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His Pro Tyr 
930 935 940 

Phe His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Val 
945 950 955 960 

Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Arg Tyr Tyr Leu Pro 
965 970 975 

Glu Lys Arg Gly Gly Lys Met Asp Ala Pro Leu Val lie Thr Thr Arg 
980 985 990 

Leu Asp Pro Arg Glu Val Asp Ser Glu Val His Asn Met Asp Val Val 
995 1000 1005 

Arg Tyr Tyr Pro Leu Glu Phe Tyr Glu Ala Thr Tyr Glu Leu Lys Ser 
1010 1015 1020 

Pro Lys Glu Leu Val Arg Val He Glu Gly Val Glu Asp Arg Leu Gly 
1025 1030 1035 1040 

Lys Pro Glu Met Tyr Tyr Gly He Lys Phe Thr His Asp Thr Asp Asp 
1045 1050 1055 

lie Ala Leu Gly Pro Lys Met Ser Leu Tyr Lys Gin Leu Gly Asp Met 
1060 1065 1070 

Glu Glu Lys Val Lys Arg Gin Leu Thr Leu Ala Glu Arg lie Arg Ala 
1075 1080 1085 
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Val Asp Gin His Tyr Val Ala Glu Thr lie Leu Asn Ser His Leu lie 
1090 1095 1100 

Pro Asp Leu Arg Gly Asn Leu Arg Ser Phe Thr Arg Gin Glu Phe Arg 
1105 1110 1115 1120 

Cys Val Lys Cys Asn Thr Lys Tyr Arg Arg Pro Pro Leu Asp Gly Lys 
1125 1130 1135 

Cys Pro Val Cys Gly Gly Lys lie Val Leu Thr Val Ser Lys Gly Ala 
1140 1145 1150 

He Glu Lys Tyr Leu Gly Thr Ala Lys Met Leu Val Ala Asn Tyr Asn 
1155 1160 1165 

Val Lys Pro Tyr Thr Arg Gin Arg He Cys Leu Thr Glu Lys Asp He 
1170 1175 1180 

Asp Ser Leu Phe Glu Tyr Leu Phe Pro Glu Ala Gin Leu Thr Leu He 
1185 1190 1195 1200 

Val Asp Pro Asn Asp lie Cys Met Lys Met He Lys Glu Arg Thr Gly 
1205 1210 1215 

Glu Thr Val Gin Gly Gly Leu Leu Glu Asn Phe Asn Ser Ser Gly Asn 
1220 1225 1230 

Asn Gly Lys Lys lie Glu Lys Lys Glu Lys Lys Ala Lys Glu Lys Pro 
1235 1240 1245 

Lys Lys Lys Lys Val He Ser Leu Asp Asp Phe Phe Ser Lys Arg 
1250 1255 1260 

(2) ANGABEN ZU SEQ ID NO: 32: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 363 Aminosauren 

(B) ART: Aminosaure 

<C) STRANGFORM: Einzelstrang 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Met Gin Ala Phe Leu Lys Gly Thr Ser lie Ser Thr Lys Pro Pro Leu 
S 1 5 10 15 

Thr Lys Asp Arg Gly Val Ala Ala Ser Ala Gly Ser Ser Gly Glu Asn 
10 20 25 30 

Lys Lys Ala Lys Pro Val Pro Trp Val Glu Lys Tyr Arg Pro Lys Cys 
35 40 45 

IS 

Val Asp Glu Val Ala Phe Gin Glu Glu Val Val Ala Val Leu Lys Lys 
50 55 60 

20 Ser Leu Glu Gly Ala Asp Leu Pro Asn Leu Leu Phe Tyr Gly Pro Pro 
65 70 75 80 

Gly Thr Gly Lys Thr Ser Thr He Leu Ala Ala Ala Arg Glu Leu Phe 
25 85 90 95 

Gly Pro Glu Leu Phe Arg Leu Arg Val Leu Glu Leu Asn Ala Ser Asp 
3o 100 105 110 

Glu Arg Gly lie Gin Val Val Arg Glu Lys Val Lys Asn Phe Ala Gin 
115 120 125 

3$ 

Leu Thr Val Ser Gly Ser Arg Ser Asp Gly Lys Pro Cys Pro Pro Phe 
130 135 140 

40 Lys lie Val He Leu Asp Glu Ala Asp Ser Met Thr Ser Ala Ala Gin 
145 150 155 160 

Ala Ala Leu Arg Arg Thr Met Glu Lys Glu Ser Lys Thr Thr Arg Phe 
4s 165 " 170 175 

Cys Leu lie Cys Asn Tyr Val Ser Arg He He Glu Pro Leu Thr Ser 
180 185 190 

50 

Arg Cys Ser Lys Phe Arg Phe Lys Pro Leu Ser Asp Lys lie Gin Gin 
195 200 205 

55 Gin Arg Leu Leu Asp He Ala Lys Lys Glu Asn Val Lys He Ser Asp 
210 215 220 

m Glu Gly He Ala Tyr Leu Val Lys Val Ser Glu Gly Asp Leu Arg Lys 
225 230 235 240 
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Ala He Thr Phe Leu Gin Ser Ala Thr Arg Leu Thr Gly Gly Lys Glu 
245 250 255 

lie Thr Glu Lys Val lie Thr Asp He Ala Gly Val lie Pro Ala Glu 
260 265 270 

Lys He Asp Gly Val Phe Ala Ala Cys Gin Ser Gly Ser Phe Asp Lys 
275 280 285 

Leu Glu Ala Val Val Lys Asp Leu lie Asp Glu Gly His Ala Ala Thr 
290 295 300 

Gin Leu Val Asn Gin Leu His Asp Val Val Val Glu Asn Asn Leu Ser 
305 310 315 320 

Asp Lys Gin Lys Ser He He Thr Glu Lys Leu Ala Glu Val Asp Lys 
325 330 335 

Cys Leu Ala Asp Gly Ala Asp Glu His Leu Gin Leu He Ser Leu Cys 
340 345 350 

Ala Thr Val Met Gin Gin Leu Ser Gin Asn Cys 
355 360 

(2) ANGABEN ZU SEQ ID NO: 33: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 329 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

Asn Leu Val Gin Cys Gly Asp Phe Pro His Leu Leu Val Tyr Gly Pro 
15 10 15 

Ser Gly Ala Gly Lys Lys Thr Arg He Met Cys He Leu Arg Glu Leu 
20 25 30 
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Tyr Gly Val Gly Val Glu Lys Leu Arg lie Glu His Gin Thr lie Thr 
35 40 45 

s Thr Pro Ser Lys Lys Lys He Glu lie Ser Thr lie Ala Ser Asn Tyr 
50 55 60 

10 His Leu Glu Val Asn Pro Ser Asp Ala Gly Asn Ser Asp Arg Val Val 
65 70 75 80 

lie Gin Glu Met Leu Lys Thr Val Ala Gin Ser Gin Gin Leu Glu Thr 
,s 85 90 95 

Asn Ser Gin Arg Asp Phe Lys Val Val Leu Leu Thr Glu Val Asp Lys 
100 105 110 

20 

Leu Thr Lys Asp Ala Gin His Ala Leu Arg Arg Thr Met Glu Lys Tyr 
115 120 125 

25 Met Ser Thr Cys Arg Leu He Leu Cys Cys Asn Ser Thr Ser Lys Val 
130 135 140 

He Pro Pro He Arg Ser Arg Cys Leu Ala Val Arg Val Pro Ala Pro 
i0 145 150 155 160 

Ser lie Glu Asp lie Cys His Val Leu Ser Thr Val Cys Lys Lys Glu 
35 165 170 175 

Gly Leu Asn Leu Pro Ser Gin Leu Ala His Arg Leu Ala Glu Lys Ser 
180 185 190 

40 

Cys Arg Asn Leu Arg Lys Ala Leu Leu Met Cys Glu Ala Cys Arg Val 
195 200 205 

45 Gin Gin Tyr Pro Phe Thr Ala Asp Gin Glu He Pro Glu Thr Asp Trp 
210 215 220 

Glu Val Tyr Leu Arg Glu Thr Ala Asn Ala He Val Ser Gin Gin Thr 
50 225 230 235 240 

Pro Gin Arg Leu Leu Glu Val Arg Gly Arg Leu Tyr Glu Leu Leu Thr 
245 250 255 

55 

His Cys lie Pro Pro Glu He He Met Lys Gly Leu Leu Ser Glu Leu 
260 265 270 

60 Leu His Asn Cys Asp Gly Gin Leu Lys Gly Glu Val Ala Gin Met Ala 
275 280 285 
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Ala Tyr Tyr Glu His Arg Leu Gin Leu Gly Ser Lys Ala lie Tyr His 
290 295 300 

Leu Glu Ala Phe Val Ala Lys Phe Met Ala Leu Tyr Lys Lys Phe He 
305 310 315 320 

Gin Asp Gly Leu Glu Gly Met Met Phe 
325 

(2) ANGABEN ZU SEQ ID NO: 34: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 354 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

Met Glu Val Glu Ala Val Cys Gly Gly Ala Gly Glu Val Glu Ala Gin 
15 10 15 

Asp Ser Asp Pro Ala Pro Ala Phe Ser Lys Ala Pro Gly Ser Ala Gly 
20 25 30 

His Tyr Glu Leu Pro Trp Val Glu Lys Tyr Arg Pro Val Lys Leu Asn 
35 40 45 

Glu lie Val Gly Asn Glu Asp Thr Val Ser Arg Leu Glu Val Phe Ala 
50 55 60 

Arg Glu Gly Asn Val Pro Asn He He He Ala Gly Pro Pro Gly Thr 
65 70 75 80 

Gly Lys Thr Thr Ser He Leu Cys Leu Ala Arg Ala Leu Leu Gly Pro 
85 90 95 

Ala Leu Lys Asp Ala Met Leu Glu Leu Asn Ala Ser Asn Asp Arg Gly 
100 105 110 
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lie Asp Val Val Arg Asn Lys lie Lys Met Phe Ala Gin Gin Lys Val 
115 120 125 

Thr Leu Pro Lys Gly Arg His Lys lie He He Leu Asp Glu Ala Asp 
130 135 140 

Ser Met Thr Asp Gly Ala Gin Gin Ala Leu Arg Arg Thr Met Glu lie 
145 150 155 160 

Tyr Ser Lys Thr Thr Arg Phe Ala Leu Ala Cys Asn Ala Ser Asp Lys 
165 170 175 

He He Glu Pro lie Gin Ser Arg Cys Ala Val Leu Arg Tyr Thr Lys 
180 185 190 

Leu Thr Asp Ala Gin lie Leu Thr Arg Leu Met Asn Val He Glu Lys 
195 200 205 

Glu Arg Val Pro Tyr Thr Asp Asp Gly Leu Glu Ala lie He Phe Thr 
210 215 220 

Ala Gin Gly Asp Met Arg Gin Ala Leu Asn Asn Leu Gin Ser Thr Phe 
225 230 235 240 

Ser Gly Phe Gly Phe lie Asn Ser Glu Asn Val Phe Lys Val Cys Asp 
245 250 255 

Glu Pro His Pro Leu Leu Val Lys Glu Met lie Gin His Cys Val Asn 
260 265 270 

Ala Asn lie Asp Glu Ala Tyr Lys He Leu Ala His Leu Trp His Leu 
275 280 285 

Gly Tyr Ser Pro Glu Asp He He Gly Asn He Phe Arg Val Cys Lys 
290 295 300 

Thr Phe Gin Met Ala Glu Tyr Leu Lys Leu Glu Phe He Lys Glu lie 
305 310 315 320 

Gly Tyr Thr His Met Lys lie Ala Glu Gly Val Asn Ser Leu Leu Gin 
325 330 335 

Met Ala Gly Leu Leu Ala Arg Leu Cys Gin Lys Thr Met Ala Pro Val 
340 345 350 

Ala Ser 
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(2) ANGABEN ZU SEQ ID NO: 35: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 366 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 

Met Lys Phe Thr Val Glu Arg Glu His Leu Leu Lys Pro Leu Gin Gin 
15 10 15 

Val Ser Gly Pro Leu Gly Gly Arg Pro Thr Leu Pro lie Leu Gly Asn 
20 25 30 

Leu Leu Leu Gin Val Ala Asp Gly Thr Leu Ser Leu Thr Gly Thr Asp 
35 40 45 

Leu Glu Met Glu Met Val Ala Arg Val Ala Leu Val Gin Pro His Glu 
50 55 60 

Pro Gly Ala Thr Thr Val Pro Ala Arg Lys Phe Phe Asp lie Cys Arg 
65 70 75 80 

Gly Leu Pro Glu Gly Ala Glu lie Ala Val Gin Leu Glu Gly Glu Arg 
85 90 95 

Met Leu Val Arg Ser Gly Arg Ser Arg Phe Ser Leu Ser Thr Leu Pro 
100 105 110 

Ala Ala Asp Phe Pro Asn Leu Asp Asp Trp Gin Ser Glu Val Glu Phe 
115 120 125 

Thr Leu Pro Gin Ala Thr Met Lys Arg Leu lie Glu Ala Thr Gin Phe 
130 135 140 

Ser Met Ala His Gin Asp Val Arg Tyr Tyr Leu Asn Gly Met Leu Phe 
145 150 155 160 
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Glu Thr Glu Gly Glu Glu Leu Arg Thr Val Ala Thr Asp Gly His Arg 
165 170 175 

Leu Ala Val Cys Ser Met Pro lie Gly Gin Ser Leu Pro Ser His Ser 
180 185 190 

Val lie Val Pro Arg Lys Gly Val lie Glu Leu Met Arg Met Leu Asp 
195 200 205 

Gly Gly Asp Asn Pro Leu Arg Val Gin lie Gly Ser Asn Asn He Arg 
210 215 220 

Ala His Val Gly Asp Phe lie Phe Thr Ser Lys Leu Val Asp Gly Arg 
225 230 235 240 

Phe Pro Asp Tyr Arg Arg Val Leu Pro Lys Asn Pro Asp Lys His Leu 
245 ~ 250 255 

Glu Ala Gly Cys Asp Leu Leu Lys Gin Ala Phe Ala Arg Ala Ala He 
260 265 270 

Leu Ser Asn Glu Lys Phe Arg Gly Val Arg Leu Tyr Val Ser Glu Asn 
275 280 285 

Gin Leu Lys lie Thr Ala Asn Asn Pro Glu Gin Glu Glu Ala Glu Glu 
290 295 300 

He Leu Asp Val Thr Tyr Ser Gly Ala Glu Met Glu lie Gly Phe Asn 
305 310 315 320 

Val Ser Tyr Val Leu Asp Val Leu Asn Ala Leu Lys Cys Glu Asn Val 
325 330 335 

Arg Met Met Leu Thr Asp Ser Val Ser Ser Val Gin lie Glu Asp Ala 
340 345 350 

Ala Ser Gin Ser Ala Ala Tyr Val Val Met Pro Met Arg Leu 
355 360 365 

(2) ANGABEN ZU SEQ ID NO: 36: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 363 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Aquifex Aeolicus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 

Met Arg Val Lys Val Asp Arg Glu Glu Leu Glu Glu Val Leu Lys Lys 
1 5 10 15 

Ala Arg Glu Ser Thr Glu Lys Lys Ala Ala Leu Pro lie Leu Ala Asn 
20 25 30 

Phe Leu Leu Ser Ala Lys Glu Glu Asn Leu He Val Arg Ala Thr Asp 
35 40 45 

Leu Glu Asn Tyr Leu Val Val Ser Val Lys Gly Glu Val Glu Glu Glu 
50 55 60 

Gly Glu Val Cys Val His Ser Gin Lys Leu Tyr Asp lie Val Lys Asn 
65 70 75 80 

Leu Asn Ser Ala Tyr Val Tyr Leu His Thr Glu Gly Glu Lys Leu Val 
85 90 95 

lie Thr Gly Gly Lys Ser Thr Tyr Lys Leu Pro Thr Ala Pro Ala Glu 
100 105 110 

Asp Phe Pro Glu Phe Pro Glu lie Val Glu Gly Gly Glu Thr Leu Ser 
115 120 125 

Gly Asn Leu Leu Val Asn Gly lie Glu Lys Val Glu Tyr Ala lie Ala 
130 135 140 

Lys Glu Glu Ala Asn lie Ala Leu Gin Gly Met Tyr Leu Arg Gly Tyr 
145 150 155 160 

Glu Asp Arg He His Phe Val Gly Ser Asp Gly His Arg Leu Ala Leu 
165 170 175 

Tyr Glu Pro Leu Gly Glu Phe Ser Lys Glu Leu Leu He Pro Arg Lys 
180 185 190 

Ser Leu Lys Val Leu Lys Lys Leu He Thr Gly He Glu Asp Val Asn 
1 95 200 205 

He Glu Lys Ser Glu Asp Glu Ser Phe Ala Tyr Phe Ser Thr Pro Glu 
210 215 220 
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Trp Lys Leu Ala Val Arg Leu Leu Glu Gly Glu Phe Pro Asp Tyr Met 
225 230 * 235 240 

Ser Val He Pro Glu Glu Phe Ser Ala Glu Val Leu Phe Glu Thr Glu 
245 250 255 

Glu Val Leu Lys Val Leu Lys Arg Leu Lys Ala Leu Ser Glu Gly Lys 
260 265 270 

Val Phe Pro Val Lys lie Thr Leu Ser Glu Asn Leu Ala He Phe Glu 
275 280 285 

Phe Ala Asp Pro Glu Phe Gly Glu Ala Arg Glu Glu lie Glu Val Glu 
290 295 300 

Tyr Thr Gly Glu Pro Phe Glu He Gly Phe Asn Gly Lys Tyr Leu Met 
305 310 315 320 

Glu Ala Leu Asp Ala Tyr Asp Ser Glu Arg Val Trp Phe Lys Phe Thr 
325 330 335 

Thr Pro Asp Thr Ala Thr Leu Leu Glu Ala Glu Asp Tyr Glu Lys Glu 
340 345 350 

Pro Tyr Lys Cys He He Met Pro Met Arg Val 
355 360 

(2) ANGABEN ZU SEQ ID NO: 37: 

<i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1 1 60 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKClLS: Protein 

<vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

Met Ser Glu Pro Arg Phe Val His Leu Arg Val His Ser Asp Tyr Ser 
1 5 10 15 
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Met lie Asp Gly Leu Ala Lys Thr Ala Pro Leu Val Lys Lys Ala Ala 
20 25 30 

Ala Leu Gly Met Pro Ala Leu Ala lie Thr Asp Phe Thr Asn Leu Cys 
35 40 45 

Gly Leu Val Lys Phe Tyr Gly Ala Gly His Gly Ala Gly He Lys Pro 
50 55 60 

lie Val Gly Ala Asp Phe Asn Val Gin Cys Asp Leu Leu Gly Asp Glu 
.65 70 75 80 

Leu Thr His Leu Thr Val Leu Ala Ala Asn Asn Thr Gly Tyr Gin Asn 
85 90 95 

Leu Thr Leu Leu lie Ser Lys Ala Tyr Gin Arg Gly Tyr Gly Ala Ala 
100 105 110 

Gly Pro He He Asp Arg Asp Trp Leu He Glu Leu Asn Glu Gly Leu 
115 120 125 

lie Leu Leu Ser Gly Gly Arg Met Gly Asp Val Gly Arg Ser Leu Leu 
130 135 140 

Arg Gly Asn Ser Ala Leu Val Asp Glu Cys Val Ala Phe Tyr Glu Glu 
145 150 155 160 

His Phe Pro Asp Arg Tyr Phe Leu Glu Leu He Arg Thr Gly Arg Pro 
165 170 175 

Asp Glu Glu Ser Tyr Leu His Ala Ala Val Glu Leu Ala Glu Ala Arg 
180 185 190 

Gly Leu Pro Val Val Ala Thr Asn Asp Val Arg Phe He Asp Ser Ser 
195 200 205 

Asp Phe Asp Ala His Glu lie Arg Val Ala lie His Asp Gly Phe Thr 
210 215 220 

Leu Asp Asp Pro Lys Arg Pro Arg Asn Tyr Ser Pro Gin Gin Tyr Met 
225 230 235 240 

Arg Ser Glu Glu Glu Met Cys Glu Leu Phe Ala Asp He Pro Glu Ala 
245 250 255 

Leu Ala Asn Thr Val Glu lie Ala Lys Arg Cys Asn Val Thr Val Arg 
260 265 270 
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Leu Gly Glu Tyr Phe Leu Pro Gin Phe Pro Thr Gly Asp Met Ser Thr 
275 280 285 

5 Glu Asp Tyr Leu Val Lys Arg Ala Lys Glu Gly Leu Glu Glu Arg Leu 
290 295 300 

10 Ala Phe Leu Phe Pro Asp Glu Glu Glu Arg Leu Lys Arg Arg Pro Glu 
305 310 315 320 

Tyr Asp Glu Arg Leu Glu Thr Glu Leu Gin Val lie Asn Gin Met Gly 
,s 325 330 335 

Phe Pro Gly Tyr Phe Leu lie Val Met Glu Phe He Gin Trp Ser Lys 
340 345 350 

20 

Asp Asn Gly Val Pro Val Gly Pro Gly Arg Gly Ser Gly Ala Gly Ser 
355 360 365 

25 Leu Val Ala Tyr Ala Leu Lys He Thr Asp Leu Asp Pro Leu Glu Phe 
370 375 380 

Asp Leu Leu Phe Glu Arg Phe Leu Asn Pro Glu Arg Val Ser Met Pro 
30 385 390 395 400 

Asp Phe Asp Val Asp Phe Cys Met Glu Lys Arg Asp Gin Val He Glu 
35 405 410 415 

His Val Ala Asp Met Tyr Gly Arg Asp Ala Val Ser Gin He He Thr 
420 425 430 

40 

Phe Gly Thr Met Ala Ala Lys Ala Val lie Arg Asp Val Gly Arg Val 
435 440 445 

45 Leu Gly His Pro Tyr Gly Phe Val Asp Arg lie Ser Lys Leu He Pro 
450 455 460 

Pro Asp Pro Gly Met Thr Leu Ala Lys Ala Phe Glu Ala Glu Pro Gin 
so 465 470 475 480 

Leu Pro Glu lie Tyr Glu Ala Asp Glu Glu Val Lys Ala Leu lie Asp 
485 490 495 

55 

Met Ala Arg Lys Leu Glu Gly Val Thr Arg Asn Ala Gly Lys His Ala 
500 505 510 

60 Gly Gly Val Val lie Ala Pro Thr Lys He Thr Asp Phe Ala Pro Leu 
515 520 525 
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Tyr Cys Asp Glu Glu Gly Lys His Pro Val Thr Gin Phe Asp Lys Ser 
530 535 540 

Asp Val Glu Tyr Ala Gly Leu Val Lys Phe Asp Phe Leu Gly Leu Arg 
545 550 555 560 

Thr Leu Thr lie He Asn Trp Ala Leu G!u Met He Asn Lys Arg Arg 
565 570 575 

Ala Lys Asn Gly Glu Pro Pro Leu Asp He Ala Ala He Pro Leu Asp 
580 585 590 

Asp Lys Lys Ser Phe Asp Met Leu Gin Arg Ser Glu Thr Thr Ala Val 
595 600 605 

Phe Gin Leu Glu Ser Arg Gly Met Lys Asp Leu He Lys Arg Leu Gin 
610 615 620 

Pro Asp Cys Phe Glu Asp Met He Ala Leu Val Ala Leu Phe Arg Pro 
625 630 635 640 

Gly Pro Leu Gin Ser Gly Met Val Asp Asn Phe lie Asp Arg Lys His 
645 650 655 

Gly Arg Glu Glu He Ser Tyr Pro Asp Val Gin Trp Gin His Glu Ser 
660 665 670 

Leu Lys Pro Val Leu Glu Pro Thr Tyr Gly lie lie Leu Tyr Gin Glu 
675 680 685 

Gin Val Met Gin He Ala Gin Val Leu Ser Gly Tyr Thr Leu Gly Gly 
690 695 700 

Ala Asp Met Leu Arg Arg Ala Met Gly Lys Lys Lys Pro Glu Glu Met 
705 710 715 720 

Ala Lys Gin Arg Ser Val Phe Ala Glu Gly Ala Glu Lys Asn Gly lie 
725 730 735 

Asn Ala Glu Leu Ala Met Lys He Phe Asp Leu Val Glu Lys Phe Ala 
740 745 750 

Gly Tyr Gly Phe Asn Lys Ser His Ser Ala Ala Tyr Ala Leu Val Ser 
755 760 765 

Tyr Gin Thr Leu Trp Leu Lys Ala His Tyr Pro Ala Glu Phe Met Ala 
770 775 780 
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Ala Val Met Thr Ala Asp Met Asp Asn Thr Glu Lys Val Val Gly Leu 
785 790 795 800 

5 Val Asp Glu Cys Trp Arg Met Gly Leu Lys He Leu Pro Pro Asp He 
805 810 815 

,„ Asn Ser Gly Leu Tyr His Phe His Val Asn Asp Asp Gly Glu He Val 
820 825 830 

Tyr Gly He Gly Ala He Lys Gly Val Gly Glu Gly Pro He Glu Ala 
is 835 840 845 

He He Glu Ala Arg Asn Lys Gly Gly Tyr Phe Arg Glu Leu Phe Asp 
850 855 860 

20 

Leu Cys Ala Arg Thr Asp Thr Lys Lys Leu Asn Arg Arg Val Leu Glu 
865 870 875 880 

25 Lys Leu He Met Ser Gly Ala Phe Asp Arg Leu Gly Pro His Arg Ala 
885 890 895 

Ala Leu Met Asn Ser Leu Gly Asp Ala Leu Lys Ala Ala Asp Gin His 
10 900 905 910 

Ala Lys Ala Glu Ala He Gly Gin Ala Asp Met Phe Gly Val Leu Ala 
3S 915 920 925 

Glu Glu Pro Glu Gin He Glu Gin Ser Tyr Ala Ser Cys Gin Pro Trp 
930 935 940 

40 

Pro Glu Gin Val Val Leu Asp Gly Glu Arg Glu Thr Leu Gly Leu Tyr 
945 950 955 960 

45 Leu Thr Gly His Pro He Asn Gin Tyr Leu Lys Glu He Glu Arg Tyr 
965 970 975 

Val Gly Gly Val Arg Leu Lys Asp Met His Pro Thr Glu Arg Gly Lys 
50 980 985 990 

Val He Thr Ala Ala Gly Leu Val Val Ala Ala Arg Val Met Val Thr 
995 1000 1005 

55 

Lys Arg Gly Asn Arg He Gly lie Cys Thr Leu Asp Asp Arg Ser Gly 
1010 1015 1020 

60 .Arg Leu Glu Val Met Leu Phe Thr Asp Ala Leu Asp Lys Tyr Gin Gin 
1025 1030 1035 1040 
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Leu Leu Glu Lys Asp Arg lie Leu He Val Ser Gly Gin Val Ser Phe 
1045 1050 1055 

Asp Asp Phe Ser Gly Gly Leu Lys Met Thr Ala Arg Glu Val Met Asp 
1060 1065 1070 

lie Asp Glu Ala Arg Glu Lys Tyr Ala Arg Gly Leu Ala He Ser Leu 
1075 1080 1085 

Thr Asp Arg Gin He Asp Asp Gin Leu Leu Asn Arg Leu Arg Gin Ser 
1090 1095 1100 

Leu Glu Pro His Arg Ser Gly Thr He Pro Val His Leu Tyr Tyr Gin 
1105 1110 1115 1120 

Arg Ala Asp Ala Arg Ala Arg Leu Arg Phe Gly Ala Thr Trp Arg Val 
1125 1130 " 1135 

Ser Pro Ser Asp Arg Leu Leu Asn Asp Leu Arg Gly Leu He Gly Ser 
1140 1145 1150 

Glu Gin Val Glu Leu Glu Phe Asp 
1155 1160 

(2) ANGABEN ZU SEQ ID NO: 38: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1161 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Aquifex Aeolicus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

Met Ser Lys Asp Phe Val His Leu His Leu His Thr Gin Phe Ser Leu 
15 10 15 

Leu Asp Gly Ala He Lys He Asp Glu Leu Val Lys Lys Ala Lys Glu 
20 25 30 
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Tyr Gly Tyr Lys Ala Val Gly Met Ser Asp His Gly Asn Leu Phe Gly 
35 40 45 

Ser Tyr Lys Phe Tyr Lys Ala Leu Lys Ala Glu Gly He Lys Pro He 
50 55 60 



10 



He Gly Met Glu Ala Tyr Phe Thr Thr Gly Ser Arg Phe Asp Arg Lys 
65 70 75 80 



15 



Thr Lys Thr Ser Glu Asp Asn He Thr Asp Lys Tyr Asn His His Leu 
85 90 95 



20 



25 



He Leu He Ala Lys Asp Asp Lys Gly Leu Lys Asn Leu Met Lys Leu 
100 105 110 

Ser Thr Leu Ala Tyr Lys. Glu Gly Phe Tyr Tyr Lys Pro Arg He Asp 
115 120 125 

Tyr Glu Leu Leu Glu Lys Tyr Gly Glu Gly Leu lie Ala Leu Thr Ala 
130 135 140 



30 Cys Leu Lys Gly Val Pro Thr Tyr Tyr Ala Ser He Asn Glu Val Lys 
145 150 155 160 



35 



Lys Ala Glu Glu Trp Val Lys Lys Phe Lys Asp lie Phe Gly Asp Asp 
165 170 175 



40 



45 



Leu Tyr Leu Glu Leu Gin Ala Asn Asn He Pro Glu Gin Glu Val Ala 
180 185 190 

Asn Arg Asn Leu He Glu He Ala Lys Lys Tyr Asp Val Lys Leu He 
195 200 205 

Ala Thr Gin Asp Ala His Tyr Leu Asn Pro Glu Asp Arg Tyr Ala His 
210 215 220 



50 



Thr Val Leu Met Ala Leu Gin Met Lys Lys Thr He His Glu Leu Ser 
225 230 235 240 



55 



Ser Gly Asn Phe Lys Cys Ser Asn Glu Asp Leu His Phe Ala Pro Pro 
245 250 255 



60 



Glu Tyr Met Trp Lys Lys Phe Glu Gly Lys Phe Glu Gly Trp Glu Lys 
260 265 270 

Ala Leu Leu Asn Thr Leu Glu Val Met Glu Lys Thr Ala Asp Ser Phe 
275 280 285 
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Glu lie Phe Glu Asn Ser f hr Tyr Leu Leu Pro Lys Tyr Asp Val Pro 
290 295 300 

Pro Asp Lys Thr Leu Glu Glu Tyr Leu Arg Glu Leu Ala Tyr Lys Gly 
305 310 315 320 

Leu Arg Gin Arg He Glu Arg Gly Gin Ala Lys Asp Thr Lys Glu Tyr 
325 330 335 

Trp Glu Arg Leu Glu Tyr Glu Leu Glu Val He Asn Lys Met Gly Phe 
340 345 350 

Ala Gly Tyr Phe Leu He Val Gin Asp Phe lie Asn Trp Ala Lys Lys 
355 360 365 

Asn Asp He Pro Val Gly Pro Gly Arg Gly Ser Ala Gly Gly Ser Leu 
370 375 380 

Val Ala Tyr Ala He Gly lie Thr Asp Val Asp Pro He Lys His Gly 
385 390 395 400 

Phe Leu Phe Glu Arg Phe Leu Asn Pro Glu Arg Val Ser Met Pro Asp 
405 410 415 

lie Asp Val Asp Phe Cys Gin Asp Asn Arg Glu Lys Val lie Glu Tyr 
420 425 430 

Val Arg Asn Lys Tyr Gly His Asp Asn Val Ala Gin He He Thr Tyr 
435 440 445 

Asn Val Met Lys Ala Lys Gin Thr Leu Arg Asp Val Ala Arg Ala Met 
450 455 460 

Gly Leu Pro Tyr Ser Thr Ala Asp Lys Leu Ala Lys Leu He Pro Gin 
465 470 475 480 

Gly Asp Val Gin Gly Thr Trp Leu Ser Leu Glu Glu Met Tyr Lys Thr 
485 490 495 

Pro Val Glu Glu Leu Leu Gin Lys Tyr Gly Glu His Arg Thr Asp He 
500 505 510 

Glu Asp Asn Val Lys Lys Phe Arg Gin lie Cys Glu Glu Ser Pro Glu 
515 520 525 

He Lys Gin Leu Val Glu Thr Ala Leu Lys Leu Glu Gly Leu Thr Arg 
530 535 540 
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His Thr Ser Leu His Ala Ala Gly Val Val lie Ala Pro Lys Pro Leu 
545 550 555 560 

Ser Glu Leu Val Pro Leu Tyr Tyr Asp Lys Glu Gly Glu Val Ala Thr 
565 570 575 



10 



Gin Tyr Asp Met Val Gin Leu Glu Glu Leu Gly Leu Leu Lys Met Asp 
580 585 590 



15 



Phe Leu Gly Leu Lys Thr Leu Thr Glu Leu Lys Leu Met Lys Glu Leu 
595 600 605 



20 



He Lys Glu Arg His Gly Val Asp lie Asn Phe Leu Glu Leu Pro Leu 
610 615 620 

Asp Asp Pro Lys Val Tyr Lys Leu Leu Gin Glu Gly Lys Thr Thr Gly 
625 630 635 640 



25 



Val Phe Gin Leu Glu Ser Arg Gly Met Lys Glu Leu Leu Lys Lys Leu 
645 650 655 



30 



Lys Pro Asp Ser Phe Asp Asp lie Val Ala Val Leu Ala Leu Tyr Arg 
660 665 670 



35 



40 



Pro Gly Pro Leu Lys Ser Gly Leu Val Asp Thr Tyr He Lys Arg Lys 
675 680 685 

His Gly Lys Glu Pro Val Glu Tyr Pro Phe Pro Glu Leu Glu Pro Val 
690 695 700 

Leu Lys Glu Thr Tyr Gly Val He Val Tyr Gin Glu Gin Val Met Lys 
705 710 715 720 



45 Met Ser Gin lie Leu Ser Gly Phe Thr Pro Gly Glu Ala Asp Thr Leu 
725 730 735 



50 



Arg Lys Ala He Gly Lys Lys Lys Ala Asp Leu Met Ala Gin Met Lys 
740 745 750 



55 



60 



Asp Lys Phe He Gin Gly Ala Val Glu Arg Gly Tyr Pro Glu Glu Lys 
755 760 765 

He Arg Lys Leu Trp Glu Asp He Glu Lys Phe Ala Ser Tyr Ser Phe 
770 775 780 

Asn Lys Ser His Ser Val Ala Tyr Gly Tyr He Ser Tyr Trp Thr Ala 
785 790 795 800 



65 
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Tyr Val Lys Ala His Tyr Pro Ala Glu Phe Phe Ala Val Lys Leu Thr 
805 810 815 

Thr Glu Lys Asn Asp Asn Lys Phe Leu Asn Leu He Lys Asp Ala Lys 
820 825 830 

Leu Phe Gly Phe Glu lie Leu Pro Pro Asp lie Asn Lys Ser Asp Val 
835 840 845 

Gly Phe Thr lie Glu Gly Glu Asn Arg He Arg Phe Gly Leu Ala Arg 
850 855 860 

He Lys Gly Val Gly Glu Glu Thr Ala Lys lie He Val Glu Ala Arg 
865 870 875 880 

Lys Lys Tyr Lys Gin Phe Lys Gly Leu Ala Asp Phe He Asn Lys Thr 
885 890 895 

Lys Asn Arg Lys lie Asn Lys Lys Val Val Glu Ala Leu Val Lys Ala 
900 905 910 

Gly Ala Phe Asp Phe Thr Lys Lys Lys Arg Lys Glu Leu Leu Ala Lys 
915 920 925 

Val Ala Asn Ser Glu Lys Ala Leu Met Ala Thr Gin Asn Ser Leu Phe 
930 935 940 

Gly Ala Pro Lys Glu Glu Val Glu Glu Leu Asp Pro Leu Lys Leu Glu 
945 950 955 960 

Lys Glu Val Leu Gly Phe Tyr He Ser Gly His Pro Leu Asp Asn Tyr 
965 970 975 

Glu Lys Leu Leu Lys Asn Arg Tyr Thr Pro lie Glu Asp Leu Glu Glu 
980 985 990 

Trp Asp Lys Glu Ser Glu Ala Val Leu Thr Gly Val lie Thr Glu Leu 
995 1000 1005 

Lys Val Lys Lys Thr Lys Asn Gly Asp Tyr Met Ala Val Phe Asn Leu 
1010 1015 1020 

Val Asp Lys Thr Gly Leu He Glu Cys Val Val Phe Pro Gly Val Tyr 
1025 1030 1035 1040 

Glu Glu Ala Lys Glu Leu He Glu Glu Asp Arg Val Val Val Val Lys 
1045 1050 1055 
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Gly Phe Leu Asp Glu Asp Leu Glu Thr Glu Asn Val Lys Phe Val Val 
1060 1065 1070 

Lys Glu Val Phe Ser Pro Glu Glu Phe Ala Lys Glu Met Arg Asn Thr 
1075 1080 1085 

Leu Tyr He Phe Leu Lys Arg Glu Gin Ala Leu Asn Gly Val Ala Glu 
1090 1095 1100 

Lys Leu Lys Gly lie He Glu Asn Asn Arg Thr Glu Asp Gly Tyr Asn 
1105 1110 1115 1120 

Leu Val Leu Thr Val Asp Leu Gly Asp Tyr Phe Val Asp Leu Ala Leu 
1125 1130 1135 

Pro Gin Asp Met Lys Leu Lys Ala Asp Arg Lys Val Val Glu Glu lie 
1140 1145 1150 

Glu Lys Leu Gly Val Lys Val He He 
1155 1160 



Patentanspruche 

1. Thermostabiler in vitro Komplex zur Template-abhangigen Elongation von Nukleinsauren, umfassend ein ther- 
mostabiles Gleitklammerprotein, welches mit einem thermostabilen Polymeraseaktivitat-aufweisenden Elongati- 
onsprotein verbunden ist. 

2. Thermostabiler Komplex nach Anspruch 1, dadurch gekennzeichnet, dass das Gleitklammerprotein und das 
Hlongationsprotein uber ein Kopplungsprotein verbunden sind. 

3. Thermostabiler Komplex nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Gleitklammerprotein und 
das Elongationsprotein aus Archaebakterien stammen. 

4. Thermostabiler Komplex nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, dass das Gleitklammerprotein 
eine ringfbrmige Struktur aufweist, welche die Template-Nukleinsaurestrange ganz oder teilweise umschlieBt. 

5. Thermostabiler Komplex nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, dass das Gleitklammer- 
protein eine oder beide der folgenden Aminosaurekonsensussequenzen aufweist: 

SEQ ID NO: 39 

rGAVLIMPFWl-D-X-X-X-IGAVLIMPFWl-X.X-FGAVLIMPFWI-X-rGAVLIMPFWl-X-[GA 
V L I M P F Wl-X-X-X-X-F-X-X-Y-X-X-D und/oder 
SEQ ID NO: 40 

IG A V L I M P F WJ-X(3)-L-A-P-[K RHD EJ-[G A VL1MPF WJ-E. 

6. Thermostabiler Komplex nach einem der Anspruche 1 bis 5, dadurch gekennzeichnet, dass das Gleitklammer- 
protein zu der menschlichen (Eukaryonten) PCNA Aminosauresequenz (SEQ ID NO: 11 ) auf eirier Lange von min- 
destens 100 Aminosauren bci einem Scqucnzalignmcnt cine mindestens 20%igc Scqucnzidcntitat aufweist und/ 
oder das Gleitldammerprotein zu der bakterielie ^-clamp Sequenz aus E.coli (Eubakteria) (SEQ ID NO: 35) auf ei- 
ner Lange von mindestens 100 Aminosauren bei einem Sequenzalignment eine mindestens 20%ige Sequenzidenti- 
tat aufweist und/oder das Gleitklammerprotein zu der Aminosauresequenz des PCNA Homologen aus Archaeoglo- 
bus Fulgidus (Archaea) (SEQ ID NO: 12) auf einer Lange von mindestens 1 00 Aminosauren bei einem Sequenza- 
lignment eine mindestens 20%ige Sequenzidenlilat aufweist. 

7. Thermostabiler Komplex nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass das Gleit- 
klammerprotein mit einem aus einem Alignment aus Abb. 12 generierten Hidden Markow Modell einen Score von 
mindestens 20 ergibt und/oder wobei das Gleitklammerprotein mit einem aus einem Alignment aus Abb. 13 gene- 
rierten Hidden Markow Modell einen Score von mindestens 25 ergibL 

8. Thermostabiler Komplex nach einem der vorhergehenden Anspriichc, dadurch gekennzeichnet dass das Gleit- 
klammerprotein ausgcwahlt ist aus AF0335 aus Archacoglobus Fulgidus, MJ0247 aus Mcthanococcus jannaschii, 
PHLA008 aus Pyrococcus horikoschii, MTH1 3 12 aus Methanobacterium thermoautotrophicus sowie AEOO0761J7 
aus Aquifex aeolicus. 

9. Thermostabiler Komplex nach einem der vorhergehenden Anspruche, dadurch gekennzeichnet, dass das Elon- 
gationsprotein eine S^'-Polymeraseaklivitat oder eine Re verse-TVanskriptaseakti vital aufweist. 

10. Thermostabiler Komplex nach Anspruch 9, dadurch gekennzeichnet, dass das Elongationsprotein mindestens 
eine der folgenden Konsensussequenzen beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz ab- 
weicht: 
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SEQIDNO:44 

D-fG A VLIMPF Wl-rG A V L I M P F W]-X-X-Y-N-X-X-X-F-D-X-P-Y-fG A V K U N O F Wl-X-X-R-A 
SEQ ID NO: 45 

A-IG A VLIMPF WJ-R-T-A-IF A V L I M P F WJ-A-IG A VLIMPF WJ-^G A VLIMPF WJ-T-E-G-LG A V 
L I M P F W]-V-X-A-P-[G A VLIMPF W]-E-G-I-A-X-V- [K R II D E]-I 5 
SEQ ID NO: 46 

[G A VLT MPF W]-P-V-G-[G A V L T M P F W]-G-R-G-S-X-[G A VLTM PF W]-G-S-[G AVKUNOFW]- 
V-A-X-A-[G A V L I M P F W]-X-I-T-D-[G AVKUNOF W]-D-P-[G A V L I M P F W]-X-X-X-[( 5 A V L I M P 
F W]-L-F-E-R-F-L-N-P-E-R-[G A V L I M P F W]-S-M-P-D. 

11. Thermostabiler Komplex nach Anspruch 9, dadurch gekennzeichnet, dass das Elongationsprotein eine zu der 10 
menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 22) auf einer Lange von mindestens 200 Amino- 
sauren bei einem Sequenzalignment eine mindestens 20%ige Sequenzidentitat aufweist und/oder zur archaebakte- 
riellen Aminosauresequenz (SEQ ID NO: 27) auf einer Lange von mindestens 400 Aminosauren bei einem Sequen- 
zalignment eine mindestens 25%ige Sequenzidentitat aufweist und/oder zur eubakteriellen Aminosauresequenz 
(SEQ ID NO: 37) auf einer Lange von mindestens 300 Aminosauren bei einem Sequenzalignment eine mindestens 15 
25%ige Sequenzidentitat aufweist. 

12. Thermostabiler Komplex nach Anspruch 9, dadurch gekennzeichnet, dass das Elongationsprotein mit einem 
aus einem Alignment aus Abb. 17 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/ 
oder wobei das Elongationsprotein mit einem aus einem Alignment aus Abb. 18 generierten Hidden Markow Mo- 
dell einen Score von mindestens 35 ergibt und/oder wobei das Elongationsprotein mit einem aus einem Alignment 20 
aus Abb. 19 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt. 

13. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass das Elon- 
gationsprotein ausgewahlt ist aus AF0497 oder AF1722 aus Archaoglobus fulgidus, MJ0885 oder MJ1630 aus Me- 
thanococcus jannaschii, PHBT047 oder PHBN021 aus Pyrococcus horikoschii, MTH1208 oder MTH1536 aus Me- 
thanobacterium thermoautotrophicus sowie PFUORF3 aus Pyrococcus furiosus. 25 

14. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass das Kopp- 
lungsprotein die folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz 
abwcicht: 

(SEQ ED NO: 43) 

[FL]-[G A V L I M P F W]-X-X-[G A V L I M P F W]-X-G-X(l 3)-[G A V L I M P F W]-X- [YR]- [G A V L I M P F 30 
W]-X-[G A V L I M P F W]-A-G-[DN]-[G AVLIMPFW]-[GAVLIMPF W]-[DS]. 

15. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass das Kopp- 
lungsprotein zu der menschlichen (Eukaryonten) Aminosauresequenz (SEQ ID NO: 16) auf einer Lange von min- 
destens 150 Aminosauren bei einem Sequenzalignment eine mindestens 18%ige Sequenzidentitat aufweist. 

16. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass das Kopp- 35 
lungsprotein mit einem aus einem Alignment aus Abb. 16 generierten Hidden Markow Modell einen Score von 
mindestens 10 ergibt. 

17. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass das Kopp- 
lungsprotcin ausgewahlt. ist aus AF1790 aus Archacoglobus fulgidus, MJ0702 aus Mcthanococcus jannaschii, 
PHBN023 aus Pyrococcus horikoschii, MTH1405 aus Methanobacterium thermoautothrophicum sowie PFUORF2 40 
aus Pyrococcus furiosus. 

18. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass der Kom- 
plex mit einem Protein assoziiert ist, welches als Gleitklammerlader fungiert 

19. Thermostabiler Komplex nach einem der vorhergehenden Anspriiche, dadurch gekennzeichnet, dass der Kom- 
plex mit ATP oder einem anderen Kofaktor assoziiert vorliegL 45 

20. Thermostabiler akzessorischer in vitro-Komplex, dadurch gekennzeichnet, dass er ein Gleitklammerprotein 
und ein Kopplungsprotein enthalt, wie sie jeweils in einem der vorhergehenden Anspriiche definiert sind. 

21 . Rekombinante DNA-Sequenz, dadurch gekennzeichnet, dass sie fur einen thermostabilen in vitro-Komplex ge- 
maB einem der Anspriiche 1 bis 19 oder fur einen thermostabilen akzessorischen Komplex nach Anspruch 20 co- 
dicrt. 50 

22. Vektor, dadurch gekennzeichnet, dass er eine fur ein Gleitklammerprotein und ein Kopplungsprotein oder/und 
ein Elongationsprotein codierende, rekombinante DNA-Sequenz enthalt. 

23. Vektor nach Anspruch 22, dadurch gekennzeichnet, dass er zusatzlich geeignete Restriktionsschnittstellen zur 
Insertion weiterer DNA-Sequenzen in einer solchen Anordnung enthalt, dass sich ein Fusionsprotein aus Gleitklam- 
merprotein und dem Expressionsprodukt der weiteren DNA-Sequenzen ergibt. 55 

24. Vektor nach Anspruch 22 oder 23, dadurch gekennzeichnet, dass er geeignete, die Expression der DNA-Se- 
quenz(en) steuemde Promotor- oder/und Operatorbereiche enthalt. 

25. Vektor nach Anspruch 24, dadurch gekennzeichnet, dass er mehrere Promotor- oder/und Operatorbereiche zur 
getrennten Expression mehrerer DNA-Sequenzen enthalt. 

26. Vektor nach einem der Anspriiche 22 bis 25, dadurch gekennzeichnet, dass cr rcprimicr- und induzicrbarc Pro- 60 
motor- oder/und Operatorbereiche enthalt. 

27. Vektor nach einem der Anspriiche 22 bis 26, dadurch gekennzeichnet, dass er eine DNA-Sequenz nach An- 
spruch 21 enthalt. 

28. Wirtszelle, dadurch gekennzeichnet, dass sie mit einem oder mehreren Vektoren nach einem der Anspriiche 22 

bis 27 transfonniert ist. 65 

29. Verfahren zur Herstellung eines thermostabilen in vitro-Komplexes gemaB einem der Anspriiche 1 bis 19 oder 
eines thermostabilen, akzessorischen in vitro-Komplexes gemaB Anspruch 20, dadurch gekennzeichnet, dass man 
eine entsprechende rekombinante DNA-Sequenz gemaB Anspruch 21 oder einen oder mehrere entsprechende Vek- 
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toren gemaB einem der Anspruche 22 bis 27 in eine Wirtszelle einbringt, die Expression der Proteine bewirkt und 
diese aus deiu Kulturmedium oder nach Zellaufschluss isoliert und gegebenenfalls noch iniL weileren Koinplexbe- 
standteilen koppelt. 

30. Verwendung eines thermostabilen, akzessorischen in vitro-Komplexes nach Anspruch 20 zur Herstellung eines 
5 thermostabilen in vitro-Komplexes nach einem der Anspriiche 1 bis 19, dadurch gekennzeichnet, dass man den ak- 
zessorischen Komplex mit einem Polymeraseaktivitat aufweisenden Elongationsprotein koppelt. 

3 1 . Vcrfahrcn zur Template- abhangigen Elongation von Nuklcinsaurcn, wobci die Nuklcinsaurc notigcnfalls dena- 
turicrt, mit mindestens einem Primer untcr Hybridisicrungsbcdingungcn verschen wird, wobci der Primer komplc- 
mentar zu einem flankierenden Bereich einer gewunschten Nukleinsauresequenz des Template-Strangs ist und mit 

to Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-Elongation erfolgt, dadurch gekennzeichnet, 
dass als Polymerase ein thermostabiler in vitro-Komplex gemaB einem der AnsprUche 1 bis 19 verwendet wird. 

32. Verfahren nach Anspruch 31, dadurch gekennzeichnet, dass man zur Amplification von DNA-Sequenzen zwei 
die gewunschte Nukleinsauresequenz fiankierende Primer und Deoxynukleotide oder/und Derivate davon oder/und 
Ribonukleotide oder/und Derivate davon verwendet. 

15 33. verfahren nach Anspruch 32, dadurch gekennzeichnet, dass man eine Polymerase-Ketten-Reaktion durchfuhrt. 

34. Verfahren nach Anspruch 3 1 , dadurch gekennzeichnet, dass man zur Reversen-lranskription von RNA in DNA 
einen theraiostabiien in vitro-Komplex gemaB einem der Anspriiche 1 bis 19 einsetzt, dessen Elongationsprotein 
Reverse-Transkriptase- Aktivitat aufweist. 

35. Verfahren nach einem der Anspriiche 31 bis 34, dadurch gekennzeichnet, dass man zur Sequenzierung von Nu- 
20 kleinsauren ausgehend von einem Primer, der zu einem der zu sequenzierenden Nukleinsaure benachbarten Bereich 

komplementar ist, eine Template- abhangige Elongation bzw. Reverse-TVanskription unter Verwendung von Deox- 
ynukleotiden und Dideoxynukleotiden oder deren jeweiligen Derivaten gemaB der Methode von Sanger durchfuhrt. 

36. Verfahren nach einem der Anspriiche 3 1 bis 35, dadurch gekennzeichnet, dass man bei der Elongation der Nu- 
kleinsauren Markierungen einfugL 

25 37. Verfahren nach Anspruch 36, dadurch gekennzeichnet, dass man markierte Primer oder/und markierte Deox- 

ynukleotide oder/und deren Derivate oder/und markierte Dideoxynukieotide oder/und deren Derivate oder/und 
markierte Ribonukleotide oder/und deren Derivate einsetzt. 

38. Vcrfahrcn zur Markicrung von Nuklcinsaurcn durch Erzcugung cinzclncr B niche in Phosphodicstcrbindungcn 
der Nuklcinsaurckcttc und Ersatz cincs Nuklcotids an den Bruchstcllcn durch cin markicrtcs Nuklcotid mit Hilfc ci- 

30 ner Polymerase, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in vitro-Komplex nach einem der 

AnsprUche 1 bis 19 eingesetzt wird. 

39. Reagenzien-Kit zur Elongation oder/und Amplifikation oder/und Reversen-TVanskription oder/und Sequenzie- 
rung oder/und Markierung von Nukletnsauren, enthaltend in einem oder mehreren getrennten Behaltern 

a) einen thermostabilen in vitro-Komplex gemaB einem der Anspriiche 1 bis 19 oder 
35 b) einen thermostabilen akzessorischen in vitro-Komplex gemaB Anspruch 20 und gegebenenfalls separat da- 

von ein Polymeraseaktivitat aurweisendes Elongationsprotein, 

sowie gegebenenfalls Primer, Puffersubstanzen, Nukieotide, ATP, einen oder mehrere andere Kofaktoren oder/und 

Pyrophosphat. 

40. Kit nach Anspruch 39, dadurch gekennzeichnet, dass cr zur Amplifikation von Nuklcinsaurcn neben den Sub- 
40 stanzen a) oder b), welche 5'-3 , -Polymeraseaktivitat aufweisen, Deoxynukleotide oder/und Derivate davon enthalt. 

41. Kit nach Anspruch 39, dadurch gekennzeichnet, dass er zur Reversen Transkription Substanzen a) oder b) ent- 
halt, welche Reverse Transkriptase-Aktivitat aufweisen, sowie Deoxynukleotide oder/und Derivate davon. 

42. Kit nach einem der Anspriiche 39 bis 41, dadurch gekennzeichnet, dass er zur Sequenzierung neben Deoxynu- 
kleotiden oder Ribonukleotiden oder/und deren Derivaten, Dideoxynukieotide oder/und deren Derivate enthalt. 

45 43. Kit nach einem der Anspriiche 39 bis 42, dadurch gekennzeichnet, dass er Primer oder/und Deoxynukleotide 

oder/und Dideoxynukieotide in markierter Form enthalt. 

Ilierzu 15 Seite(n) Zeichnungen 
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Abbildung 2: 



Komponenten des 

Elongations- 

holoenzyines 


Eubakteria 
Escherichia coli 


Aquifex Aeolicus 
(%ldentitat | 
Alignmentlange) 1 


Gleilklaimner 


DP3BJECOLI 
[SEQ ID NO:35] 


AASEQ93 
(28% |370) 
(SEQ ID NO:36] 


Elongaiionsprotein 


DP3A_ECOLI 
[SEQ ID NO:37] 


AASEQ50 
(37% |1154) 
[SEQ ID NO:38] 
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IntCI. 7 : C 12 N 9/12 
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Gleitklammer Region 1: 

PCNA_HUMAN : MDSSHVSLVQLTLRSEGFDTYRCD 

PCNA_METJA : MDPSHVALVSLEIPRLAFEEYEAD 

MTH1312 : LDRSHITYVHLELKAELFDEYVCD 

PHLA008 : MDPSRWLIDLNLPSSIFSKYEVD 

AF0335 : VDPANVAMVIVDIPKDSFEVYNID 

Konsensus : $DXXX$XX$X$X$XXXXFXXYXXD 

Pattern : [GAVLIMPFW] -D-X-X-X- [GAVLIMPFW] -X-X- [GAVLIMPFW] -X- 
[GAVLIMPFW] -X- [GAVLIMPFW] -X-X-X-X-F-X-X-Y-X-X-D 



Gleitklammer Region 2; 



PCNA_HUMAN 

PCNA_METJA 

MTH1312 

PHLA008 

AF0335 

Konsensus 

Pattern 



LKYYLAPKIE 
LTFLLAPRIE 
LSFLLAPRIE 
LTFLLAPRVE 
VEYILAPRIE 

$XXXLAP&$E 

[GAVLIMPFW] -X ( 3 ) -L-A-P- [KRHDE] - [GAVLIMPFW] -E 
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Abbildunq 5: 



Koppelnde Untereinheit : 



PHBN023 : FLEWLNGYVESKEEEEIVSRIRYLIIAGDWD 

PfuORF2 : FLBWLNGNVETKEEEEIVSRVKYLIIAGDWD 

DPD2_HUMAN : LVDWTGQLGDEGEQCSAAHVSRVILAGNLLS 

MTH1405 : FVKWINGDFGSEEQRSLAADVKYLWAGDIVD 

AF1790 : FVRWLKGEVGGKKSQNLAEKVKYIVIAGDIVD 

MJ0702 : FI RFLNGDVDNEL EEKWS RLK Y I C IAGDL VD 



KonseilSUS : F$XX$XGXXXXXXXXXXXXX$XY$X$AGD$$D 
L R N S 



Pattern : [FL] - [GAVLIMPFW] -X-X- [GAVLIMPFW] -X-G-X ( 13 ) - [GAVLIMPFW] -X- 
[YR] - [GAVLIMPFW] -X- [GAVLIMPFW] -A-G- [DN] - [GAVLIMPFW] - [GAVLIMPFW] - [DS] 



Abbilduncr 6; 



Gleitklammer lader : 

AC11JJUMAN : CNYLSKI IPALQSRCTRFRFGPL 
AF2060 : CNYVSRIIEPIQSRCAVFRFKPV 

MTH0241 : CNYSSKI IDPIQSRCAIFRFLPL 

PHBN012 ; CNYSSKIIEPIQSRCAIFRFRPL 

MJ1422 : CNYPSKIIPPIQSRCAVFRFSPL 

Konsensus : CNYXS&IIX$$QSRCXXFRFXP$ 

Pattern : C-N-Y-X-S- [KRHDE] -I-I-X- [GAVLIMPFW] - [GAVLIMPFW] -Q-S-R-C- 
X-X-F-R-F-X-P- [GAVLIMPFW] 
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Abfrildimq 7: 



Gleitklairanerlader 2: 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 

Konsensus 

Pattern 
[GAVLIMPFW] 



KAALLSGPPGVGKTTTASLV 
KPILLVGPPGCGKTTLAYAL 
KPLLLAGPPGVGKTSLALAL 
KPLLLVGPPGTGKTTLAHII 
KALLLAG P PG S GKTTTVY AL 

KXXLLXGPPGXGKT§X$XX$ 

K-X-X-L-L-X-G-P-P-G-X-G-K-T- [STNQYC] -X- [GAVLIMPFW] -X-X- 



Abbilduna 8; 



Elongationprotein 1 



DPOD_HUMAN 

DPOL_ARCFU 

MTH1208 

PHBT047 

MJ0885 



DVITGYNIQNFDLPYLISRA 
DI IVGYNQDAFDWP YLRKRA 
DILVGYNSDNFDFPYITRRA 
DVI ITYNGDNFDFP YLLKRA 
DVIYTYNGDNFDFPYLKARA 



Konsensus 



D$ $XXYNXXXFDXPY$XXRA 



Pattern : D- [GAVLIMPFW) - [GAVLIMPFW] -X-X-Y-N-X-X-X-F-D-X-P-Y- 
[ GAVLIMPFW] -X-X-R-A 



902 066/569 



ZEICHNUNGEN SEITE 7 



Nummer 
Int. CI. 7 : 

Offenlegungstag: 



DE 19840 771 A1 
C12N 9/12 

10. Februar 2000 



Elongationsprotein 2 



AF1722 

MJ1630 

PfuORF3 

MTH1536 

PHBN021 



AVRTAVAIMT EGW AAP I EG I ARVR I 
AVRTALAVLTEG I VAAPLEGI ADVK I 
AVRTALAILTEG I VSAPLEG I ADVKI 
ALRTALAILTEGWAAPLEGIARVRI 
AVRTALAILTEGWSAPIEGIASVKI 



KonsenSUS: A$RTA$A$$TEG$VXAP$EGIAXV&I 

Pattern : A- [GAVLIMPFW] -R-T-A- [GAVLIMPFW] -A- [GAVLIMPFW] - [GAVLIMPFW] 
T-E-G- [GAVLIMPFW] -V-X-A-P- [GAVLIMPFW] -E-G-I-A-X-V- [KRHDE] -I 



Abbildunq 10; 



Elongationsprotein ( Eubakteria ) 

DP3A_EC0LI : VPVGPGRGSGAGSLVAYALKITDLDPLEFDLLFERFLNPERVSMPD 
DP3A_SALTY : VPVGPGRGSGAGSLVAYALKITDLDPLEFDLLFERFLNPERVSMPD 
BB0579 : IPVGAGRGSGAGS IVAYALRITDIDPLKYNLLFERFLNPERISMPD 

DP3A_HELPY : IPVGPGRGSAAGSLVAFALKITDIDPLKYDLLFERFLNPERISMPD 
AA50 : IPVGPGRGSAGGSLVAYAIGITDVDPIKHGFLFERFLNPERVSMPD 

Konsensus : $PVG$GRGSX$GS$VAXA$XITD$DP$XXX$LFERFLNPER$SMPD 

Pattern : [GAVLIMPFW] -P-V-G- [GAVLIMPFW] -G-R-G-S-X- [GAVLIMPFW] -G-S- 

[GAVLIMPFW] -V-A-X-A- [GAVLIMPFW] -X-I-T-D- [GAVLIMPFW] -D-P- [GAVLIMPFW] -X- 
X-X- [GAVLIMPFW] -L-F-E-R-F-L-N-P-E-R- [GAVLIMPFW] -S-M-P-D 



902 06^569 



ZEICHNUNGEN SEITE 8 



Nummer; 
Int. CI. 7 : 

Offenlegungstag: 



DE 198 40 771 A1 
C12N 9/12 

10. Februar 2000 



Afabi Idling 11: 



Gleitklammer (Eubakteria) Region 1: 

AAP0L3B : KLVITGGKSTYKLPTAPAEDFP 

DP3B_EC0LI : RMLVRSGRSRFSLSTLPAADFP 

S.TYPHIM. : RMLVRSGRSRFSLSTLPAADFP 

DP3B_PR0MI : RLLVRSGRSRFSLSTLPASDFP 

DP3B_PSEPU : KLLVKAGRSRFTLSTLPANDFP 

DP3B_STRCO : RATWCGS S RFTLHTL P VEE Y P 

Konsensus : &XX$XXGXSXXXLXT$P$X&XP 

Pattern : [KRHDE] -X-X- [GAVLIMPFW] -X-X-G-X-S-X-X-X-L-X-T- 
[GAVLIMPFW] -P- [GAVLIMPFW] -X- [KRHDE] -X-P 



Gleitklammer (Eubakteria) Region 2: 

AAPOL3B : IIMPMRV 

DP3B_ECOLI : WMPMRL 

S.TYPHIM. : WMPMRL 

DP3B_PROMI : WMPMRL 

DP3B_PSEPU : WMPMRL 

DP3B_STRCO : LIMPVRL 

Konsensus : $$MP$R$ 

Pattern : [GAVLIMPFW] - [GAVLIMPFW] -M-P- [GAVLIMPFW] -R- [GAVLIMPFW] 
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ZEICHNUNGEN SEITE 9 



(Mummer 
Int. CI. 7 : 

Offenfegungstag: 



DE 19840 771 A1 
C12N 9/12 

10. Feb ruar 2000 



Abbildung 12: 



* 20 * 40 * 

PCNA_HUMAN : LINEACWDISSSCTVNLQSMDSSHVSLVQ ' 58 

PCNA_METJA : LLDEICFEVDEEG IKASAMDPSHVALVSLE I PRLAFEEYEADS - HDIG IDLEAFKKVM : 57 

MTH1312 : IVDIVQIQLSAEGLRLDALDRSHITYVHLEUCA^ : 58 

PHLA008 : LIDEAAFKVTEEGISMRAMDPSRWLIDI^^ : 58 

AF0335 : LVSEARIHFLEKGLHSRAVDPAWAMVIVDIPKDSFEVYWIDEEKTIGVI^DRIFDIS : 58 

60 * 80 * 100 * 

PCNA_HUMAN : KCAGNEDI ITLRAEDNADTLALVFEAPNQEKVSD — I PEQEYSC : 114 

PCNA_METJA : NRAKAKDRLILELDEEKNKLNVTFENTG KRKFSLALLDISASSVK — VPEIEYPN : 110 

MTH1312 : KRAKANDRVILSTDEG-N-LIIQFEGEA VRTFKIRLIDIEYETPS — PPEIEYEN : 109 

PHLA008 : KRGKAKDTLILRKGEE-NFLEISLQGTA TRTFRLPLIDVEEIEVE — LPDLPYTA : 110 

AF0335 : KS I S TKDLVEL TVEDE - STLKVKFG SVE YKVALIDP SAIRKEPRI PELELPA : 109 

120 * 140 * 160 * 

PCNA^HUMAN : VVKMPSGEFARICRDLSHIGDAWISCAKIX5VKFSASGELGNGNIKLSQTSNVDKEEE : 172 

PCNA_METJA : VIMIKGDAFKEALKDADLFSDYVILKADEDKFVI HAKGDLNENEA IFEKDSSA : 163 

MTH1312 : EFEVPFQLLKDSIADIDIFSDKITFRVDEDRFIASAEGEFGDAQIEY : 156 

PHLA008 : KWVLGEVLKEAVKDA SLVSDS IKFMAKENEF IMRAEGETQEVEVKLTLEDEG : 163 

AF0335 : KIVMDAGEFKKAIAAADKISDQVIFRSDKEGFRIEAKGDVDSIVFHMT-ET : 159 

180 * 200 * 220 * 

PCNA_HUMAN : AVTIEMNEPVQLTFALRYI^FTKATPLSSTVTLSMSADVPLVVEYKIADM-GHLKYY : 229 

PCNA_METJA : IISLEVKEEAKSAFNLDYLMDMVKGVSSGDIIKIYLGNDMPLKLEYSIAG--V1^TFL : 219 

MTH1312 : LHGERIDKPARSIYSLDKIKEMLKADKFSETAIINLGDDMPLKLTLKWASKEGELSFL : 214 

PHLA008 : LLDIEVQEETKSAYGVSYLADMVKGIGKADEVTMRFGNEMPMQMEYYIRDE : 220 

AF0335 : EL IEFNGGEARSMFSVDYLKEFCKVAG SGDLLTI HLGTNYPVRLVFELVGGRAKVEYI : 217 



PCNA — HUMAN 


: LAPKIED : 


236 


PCNA_METJA 


: LAPRIEG 


226 


MTH1312 


: LAPRIEA 


221 


PHLA008 


: LAPRVEE 


227 


AF0335 


: LAPRIES • 


224 
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ZEICHNUNGEN SEITE 10 Nummer: DE 19840 771 A1 

IntCI. 7 : C 12 N 9/12 

Offenlegungstag: 10. Februar 2000 



Abbildung 13: 



AAP0L3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PR0MI 

DP3B_PSEPU 

DP3B_STRC0 



* 20 * 40 * 

MRVKVDREELEEVLKKARESTEKKAALP I LANFLLSAKEENL IVRATDLENYLVVSVK 
MKFTVEREHLLKPLQQVSG PLGGRPTLP ILGNLLLQVADGTLSLTGTDLEMEMVARVA 
MKFTV'EREHLLKPLQQVSGPLGGRPTLP ILGNLLLQVADGTL SLTGTDLEMEMVARVT 
MKF I IEREQIXKPLQQVSGPI^GRPTLP ILGNLLLKVTEJNTL SLTGTDLEMEMMARVS 
MHFTIQREALLKPLQLVAGVVERRQTLPVLSNVLLVVQGQQLSLTGTDLEVELVGRVQ 
MKIRVERDVLAEAVAWAARSLPARP P APVLAGLLLKAEEGQLSLS SFDYEVSARVSVE 



58 
58 
58 
58 
58 
58 



60 * 80 * 100 * 

AAP0L3B - GEVEEE-GEVCraSQKLYDIVKNL-NSAYV^ 

DP3B ECOLI : LVQPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGERMLVRSGRSRFSLSTLPAADF 

S TYPHIM • LSQPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGDRMLVRSGRSRFSLSTLPAADF 

DP3B PROMI 1 LSQSHEIGATTVPARKFFDIWRGLPEGAEISVELDGDRLLVRSGRSRFSLSTLPASDF 

DP3B~PSEPU : LEEPAEPGEIWPARKLMDICKSLPOTALIDIKVDEQKLLVKAGRSRFTIiSTLPANDF 

DP3B"STRCO : AE IEEE -GTVLVSGRLLADI SRAL - PNRPVEI STDGVRATWCG SSRFTLHTLPVEEY 



114 
116 
116 
116 
116 
114 



120 * 140 * 160 * 

AAPOL3B : PEFPEIVE-GGETLSGNLLVNGIEKVEYAIAKEEANIALQGMYLRGYEDRIHFVGSDG 

DP3B ECOLI • PNLDDWQSEVEFTLPQATMKRL I EATQFSMAHQDVRYYLNGMLFETEG EELRTVATDG 

S TYPHIM : PNLDDWQ SEVEFTL PQATMKRL I ES TQFSMAHQDVRYYLNGMLFETEG SELRTVATDG 

DP3B_PROMI : PNLDDWQSEVEFTLPQATLKRL I ESTQFSMAHQDWYYLNGMLFETENTELRTVATDG 

DP3B PSEPU • PTVEEGPGSLTCKLEQSKLRRLIERTSFAMAQQDVRYYI^GMLLEVSRNTLRAVSTIXS 

DP3B STRCO : PALPQMPE-ATGTVPGEVFASAVQQVAIAAGRDDTLPVLTGVRIEIEGDSVTLASTDR 



171 
174 
174 
174 
174 
171 



180 * 200 * 220 * 

AAP0L3B : HRLAL YEPLG EF SKEL LIPRKSLKVLKKLITGIEDVNIEKSE DESFAYFS 

DP3B_ECOLI : HRLAVCSMPIGQSLPS--HSVIVPRKGVIELMRMLDG-GDNPLRVQI-— GSNNIRAH 

S TYPHIM • HRLAVCSMPLEASLPS--HSVIVPRKGVIELMRMLDG-GENPLRVQI GSNNIRAH 

DP3B_PROMI : HRLAVCAMDIGQ SL PG - - HSVIVPRXG VI ELMRLLDG SGESLLQLQ I G SNNLRAH 

DP3B_PSEPU : HRLALCSMSAPIEQEDR-HQVIVPRKGILELARLLTD-PEGMVSIVL GQHHIRAT 

DP3B STRCO : YRFAVREFLWKPENPD I SAVALVPAKTLQDTAKALTSGDQVI LAL SG SGAGEG LIGFE 



221 
226 
226 
227 
227 
229 



AAPOL3B 

DP3B_ECOLI 

S . TYPHIM . 

DP3B_PROMI 

DP3B_PSEPU 

DP3B.STRCO 



240 * 260 * 280 * 

TPEWKIJVVRLLEGEFPDYMSVIPEEFSAEVLFETEEVLKVL^ : 279 

VGDFIFTSKLVTCRFPDYRRVLPKNPDKHLEAGCDLIJCQAFARAAILSNEKFRGVRLY : 284 

VGDFIFTSKLVDGRFPDYRRVLPKNPDKHLEAGCDILKQAFARAAILSNEKFRGVRLY : 284 

VGDFIFTSKLVDGRFPDYRRVLPKNPTKTVXAGCDILKQAFSRAAILSNEKFRGVRIN : 285 

TGEFTFTSKLVDGKFPDYERVLPKGGDKLWGDRQALREAFSRTAILSNEKYRGIRLQ : 285 

GAGRRTTTRLLEGDLPKYKTLFPTEFNSVAV I ETAPFVEAVKRVALVA- ERNTPVRL S : 286 



300 * 320 * 340 

AAPOL3B : LSENIJ^IFEFADPEFGEAREEIEVTIYTGEPFEIGFNGKYLMEALDAYDSERVWFKFOT 

DP3B_ECOLI : VSENQLKITANNPEQEEAEEILIWTYSGAEMEIGFNVSYVIJ3V^ 

S TYPHIM. : VSE^QLKITAmPEQEE^EEIIJDVSYGGTEMEIGFNVSYVLDVI^ALKCETVRIMLT- 

DP3B_PROMI : LTNGQLKITAimPEQEEAEEIVDVQYQGEEMEIGFWSYLLDVLNTLKCEEVKLLLT- 

DP3B_PSEPU : IAAGQLKIQANNPEQEEAEEEISVDYEGSSLEIGFWSYLLDVLGVMTTEQVRLILS- 

DP3B.STRCO : FEQGVLILEAGSSDDAQAVERVDAQLEGDDISIAFNPTFLLDGLSAIDSPVAQLSFTT 



337 
341 
341 
342 
342 
344 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B.STRCO 



* 360 * 380 

— PDTATLLEAEDYEK- EP YKC IIMPMRV- - 

DSVSSVQIEDAAS-QSAAYWMPMRL — 

DSVSSVQIEDAAS-QSAAYWMPMRL- - 

DAVS SVQVENVAS - AAAA YWMPMRL - - 

DSNSSALLQEAGN-DDSSYWMPMRL- - 

STKPALLSGRPAVDAEADEAYKYLIMFVRLSG 



363 
366 
366 
367 
367 
376 
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ZEICHNUNGEN SEITE 11 



Nummer. 
Int. CI. 7 : 

Offenlegungstag: 



DE 198 40 771 A1 
C12N 9/12 

10. Feb mar 2000 



Abbildung 14: 



* 20 * 40 * 60 

AC11 HUMAN : ICim,SKIIPAl^SRCTRFRFGPLTPED : 60 

AF2060 • SCNYVSRIIEPIQSRCAVFRFKPVPKEAMKKRLLEICEKEGVKITEDGLEALIYISGGDF : 60 

MTH0241 : SCNYSSKIIDPIQSRCAIFRFLPLKGHQIIKRLEYIAEKENLEY : 60 

PHBN012 : SCNYSSKIIEPIQSRCAIFRFRPLRDEDIAKRLRYIAENEGLELTEEGLQAILYIAEGDM : 60 

MJ1422 : NCIWSKIIPPIQSRCAWRFSPLKKEDIAKK^ s 60 



* 80 * 100 * 120 

AC 1 INHUMAN : RRAI^ILQSTNMAFGKVTEETVYTCTGHPLKSDI^ : 120 

AF2060 : RKAINALQGAAAIGEVVDAOTIYQITATARPEEMTELIQTAI^ : 120 

MTH0241 : RKAINLLQSAASLXSEKITESSIYDWSRARPKDVRKMIKTIIJXSKFM^ : 120 

PHBN012 : RRAINILQAAAAI^KKITDENVFMVASRARPOT = 120 

MJ1422 : RKAINVLQTAAALSDVIDDErVYKVSSRARPEEVKKJ^^ : 120 



AC 1 INHUMAN : GLALHDILTEIHLFVHRVD : 139 

AF2060 : GMSGEDIVAQLFREIISMP : 139 

MTH0241 : GISGEDMVTQIYQELSRLA : 139 

PHBN012 : GLSGEDVLIQMHKEVFNLP : 139 

MJ1422 : GMSGEDILNQMFREINSLD : 139 



902 066/569 



ZEICHNUNGEN SEITE 12 Nummer: DE 19840 771 A1 

IntCI. 7 : C12N 9/12 

Offenlegungstag: 10. Februar 2000 



Abbildung 15: 



* 20 * 40 * 

AC15 HUMAN : LLWVDKYKPTSLKTI IGQQGDQSCANKLIJIWLRNWQKSSSEDKKHAAKFGKF SGKDDG 

MJ0884 : LSWVEKYRPKSLKDVAG HEKVKEKLKTWIESYLKGET 

A*1195 : ML WEKYRPKTLEEWA DKSI I TRVIKWAKSWKRG - 

MTH0240 : MSWTEKYRPG SFDEWG NQKVI AEIKEWIKAWKAGKP 

PHBN013 : VPWIEKYRPRKLSEIVN QEQALEKVRAWIE SWLHGNPPK 



58 
37 
35 
37 
39 



AC15_HUMAN 
MJ0884 
AF1195 .. 
MTH0240 
PHBN013 



60 * 80 * 100 * 

SSFKAALLSGPPGVGKTTTASLVCQELGYSYVELNASDTRSKSSLKAIVAESLNNTSI 

— PKPILLVGPPGCGKTTIJVyAIJUroYGFEVIEljNASDKRNSSAIKKVA/GHAATSSSI 
_ _ SKPLLLAG P PGVGKTSIAIALANTMGWEAVELNASDQRSWRVI ERIVGEG AFNETI 

- - QKPLLLVGPPGTGKTTLAHIIGKEFS-EJTLELNASDRRSQDALMRSAGEASATRSL 
--KKALLIJ^PPGSGKTTTVYALAHEYNFEVIEL^ 



116 
93 
91 
92 
94 



120 * 140 * 160 * 

AC15 HUMAN : KG FYSNG AA SSVSTKHAL IMDEVDGMAGNEDRGG IQELIG L IK- HTKIP 1 1 CMCNDRN 

MJ0884 ' FG KKF-LIVLDEVDGISGKEDAGGVSELIKVIK-KAKNPIILTAITOAY 

AF1195 : SDEGEF-LSSRIGKLKLIIUDEVDNIHKKEDVGGEAALIRLIKRKPAQPLILIANDPY 

MTH0240 • FN HDLKL 1 1 LDEVDG I HGNEDRGG VQ AINRI IK - ESRH PMVLTAND P Y 

PHBN013 : MG KRRKIIFLDEADNIE — P — SGAPEIAKLID-KARNPIIMAANHYW 



173 
139 
148 
139 
137 



AC15_HUMAN 

MJ0B84 

AF1195 

MTH0240 

PHBN013 



180 * 200 * 220 * 

HPKIRSLVHYCFDLRFQRPRVEQIKGAMMSIAFKEGLKIPPPAMNEIILGANQDIRQV 
APSIRSLLPYVEVIQLNPVHTNSVYK\OiKKIAEKEGLDVDDKTLKMIAQHSAGDLRSA 
KLSP - ELRNIXEMINFKRLTKQQVARVLERI ALKEG IKVDKSVLLKIAENAGGDLRAA 
SKRLQSIKPRCRV1OTJUCWTSSIAAAUUIICRAEGIECPDDVLR 
EVPK - EIRDRAELVE YKRLNQRDVI S ALVRI LKREG ITVPKE I LTE I AKRS SGDLRAA 



231 
197 
205 
197 
194 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 



240 * 260 * 280 * 

LHNLSMWCARSKALTYDQAKADSHRAKKDIKMGPFDVARKVFAAGEETAHMSLVDKSD 

INDLEALALSGDLSYEAAQKLP DRKREANI FD ALRVI LKTTHYG IATTALMN- - 

INDFQALAEGKEELKPEDVFLT KRTQEKDIFRVMQMIFKTKNPAVYNEAML 

INDLEAMAEGEERIGEELLKMG EKDATSNLFDAVRAVLKSRDVSKVREAMR 

INDLQTIVAGG- - YEDAKYVLA YRDVEKTVFQSLGMVFSSDNAKRAKLALMN- - 



289 
249 
256 
248 
244 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 



300 * 320 * 340 

LFFHDYSIAPLFVQENYIHVKPVAAGGDMKKHLMLLSRAADSICDGDLVDSQIRSKQN : 347 

VDETPDWIEWIAENVPKEYEKPEEVARAFEYLSKADRYLGRVMRRQN--YSF : 300 

LDESPEDVIHWVDENLPLEYSG-VELVNAYEALSRADIFLGRVRRRQF— YRL : 306 

VDDPPTLVLEF I AENVPREYEKPNEISRAYDML SRADIFFGRAVRTRN YTY : 299 

LDMSPDEFLLWVDENIPHMYIiKPEEMARAYEAISRADIYLGRAQRTGN YSL : 295 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 



360 * 380 * 400 

WSLLPAQAIYASVLPGELMRGYMTQFPTFPSWLGKWSSTGKHDRIVQDLALHMSLRTY 

WKYATTLMTAGVAL SKDEKYRKWTP YS Y- PKI FRLLTKTKAERE I LNKILKKIGEKTH 
WKYA SYLMTVGVQQMKEEPKKGFTRYRR- PAVWQMLFQLRQKREMTRKILEKIGKYSH 
WRYA SELMG PGVALAKDKTYRKFVRYTG - SS SFRILGKTRKQRSLRDSV AAKMAGKMH 
WKYAIDMMTAGVAVAGTK- KKGFAKFYP- PNTLKMLAESKEERSIRDSI IKKIMKEMH 



405 
357 
363 
356 
351 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 



* 420 

SSKRTVNMDYLSLLR : 420 

TSSKRAR- FDLQMLK : 371 

L SMRKARTEMFPVIK : 378 

ISPKVAI-SMFPYME : 370 

MSJCLEAL-ETMKILR : 365 
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ZEICHNUNGEN SEITE 13 



Numm n 
Int. CI. 7 : 

Offentegungstag: 



DE 198 40 771 A1 
C12N 9/12 

10. Februar 2000 



Abbildung 16: 

* 20 * 40 * 

PHBN023 : IFEVEDQTDRVKVFLPKDSED- YREALKVLPDAVVAFKGVYSKRG - IFFANRFYLPDV : 56 

PfuORF2 : IFEIEDLTGKVKVFLPKDSED-YREAFKVLPDAWAFKGWSKRG-ILYANKFYLP : 56 

DPD2_HUMAN : -LVLEDELQRIKLKGTIDVSK LVTGTVLAVFG SVRDDG KFLVEDYC F ADLA : 50 

MTH1405 : IIELEDDTGEISVVVHNENHKLFEKSEKIVRDEWGVHGTKKGR- - FWASEIFHPGV : 56 

AF1790 : YIRLEDTTGTI TCVATGKNAE VARELLGDEVIGVTGLLKGS- -SLYANRIVFPDV : 53 

MJ0702 : IVRIEDTEDEATLILPKEKIEAGKIPDDILLDEVIGAIGTVSKSGSSIYVDEIIRPAL : 58 



PHBN023 

PfuORF2 

DPD2_HUMAN 

MTH1405 

AF1790 

MJ0702 



60 * 80 * 100 * 

PLYRK- QKPPLEEKVYAVLTSDIHVG SK- - EFCEKAFIKFLEWLNG YVESKEEEEIVS : 111 

PLYRR- QKPPLEEKVYAILI SDIHVG SK- - EFCENAFIKFLEWLNGNVETKEEEEIVS : 111 

PQKP- - APP - LDTDRFVLLVSGLGLGGGGGE SLLGT- QLLVDWTGQLGDEG EQCSAA : 104 

PRIQ--EK EMDFSVAFISDVHIGSQ — TFLEDAFMKFVKWINGDFGSEEQRSLAA : 107 

PINGNGEK KRDFYIVFLSDTHFGSK — EFLEKEWEMFVRWLKGEVGGKKSQNLAE : 106 

PPKEP-KR--IDEEIYMAFLSDIHVGSK--EFLHKEFEKFIRFLNGDVDNELEEKWS : 111 



PHBN023 

PfuORF2 

DPD2_HUMAN 

MTH1405 

AF1790 

MJ0702 



120 * 140 * 160 * 

RIRYLZ.IAGDWD-GIGIYP-GQYSDLIIPDIFDQYEALANLLSNVP KHITIFI : 163 

RVKYL I IAG DWD-G VGVYP -G Q YADLTI PDIFDQYEALANLL SHVP KHITMFI : 163 

HVSRVIIAGNLLSHSTQSRDSINKAKYLTKKTQAASVEAVKMLDEILLQLSASVPVDV : 162 

DVKYLVVAGDXVD-GIGIYP-GQEKELLIRDIHEQYEEAARLFGDIR SDIKIVM : 159 

KVKYIVIAGDIVD-GIGVYP-GQEDDLAISDIYGQYEFAASHLDEIP KEIKIIV : 158 

RLKYICIAGDLVD-GVGVYP-GQEEDLYEVDIIEQYREIAMYLDQIP EHISIII : 163 



180 * 200 * 220 * 

PHBN023 : G PGNHDAARPA I PQPEF YEEYAKPL YKLKNTVI I SNPAVIRLHGRDFLIAHG RG IEDV : 221 

PfuORF2 : APGNHDAARQAIPQPEFYKEYAKPIYKLKNAVIISNPAVIRLHGRDFLIAHGRGIEDV : 221 

DPD2 HUMAN : MPGEFDPTNYTLPQQPLHPCMFPLATAYSTLQLVTNPYQATIIX5VRFLGTSGQNVSDI : 220 

MTH1405 : I PGNHDSSRIAEPQPAI PEEYAKSLYSIRNIEFLSNPSLVSLDGVRTLIYHGRSFDDM : 217 

AF1790 : SPGNHDAVRQAEPQPAFEG EI- RSLF P- KNVEHVGNPAYVD I EGVKVLIYHGRS IDDI : 214 

MJ0702 : SPGNHDAVRPAEPQPKLPEKITKLFNR-DNIYFVGNPCTLNIHGFDTLLYHGRSFDDL : 220 



240 * 260 * 280 * 

PHBN023 : VSFVPGLTHHKPGLPMVELLKMRHLAPTFGGKVPIAPDPE-DLLVIEEVPDLVQMGHV : 278 

PfuORF2 : VGSVPGLTHHKPG LPMVELLKMRHVAPMFGGKVP IAPDPE-DLLVIEEVPDWHMG HV : 278 

DPD2_HUMAN : FRYS SMEDHLEILEWTLRVRHISPTAPDTLGCYPFYKTDPFIFPECPHVYFCGNT : 275 

MTH1405 : AMSVNGLSHERSDLIMEELLEKRHLAPIYGERTPLASEIE-DHLVIDEVPHVLHTGHV : 274 

AF1790 : ISKIPRLSYDEPQKVMEELLKRRHLSPIYGGRTPLAPERE-DYLVIEDVPDILHCGHI : 271 

MJ0702 : VGQ I RAAS YENPVTIMKEL IKRRLLC PTYGGRC P I APEHK- DYLVIDRD IDI LHTGHI : 277 



300 * 320 * 

PHBN023 : HVYDTAVYRG VQLVNSATWQ AQTEFQKMVNIVPTPGLVP IVD : 320 

PfuORF2 : HVYDAWYRG VQLVNSATWQAQTEFQKMVNIVPTPAKVTWD : 320 

DPD2_HUMAN : PSFGSKI IRGPEDQTVLLVTVPDF- SATQTACLVNLR- SLACQPISF : 320 

MTH1405 : HINAYKKYKG VHLINSGTFQSQTEFQKIYNTVPTCGQVWLN : 316 

AF1790 : HTYGTGFYRG VFMVNSSTWQAQTEFQKKVNLNPMPGNVAVYR : 313 

MJ0702 : HINGYGIYRG WMVNSGTFQEQTDFQKRMGISPTPAIVPIIN : 319 
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Abbildung 17: 



* 20 * 40 * 

DPOD HUMAN : KVQSYEKEEDLLQAWSTF IRIMDPDVITG YN IQNFDLPYL I SRAQTLKVQTF PFLGRV 
DPOL~ARCFU : EIILTGDERKIISDFVKLIKSYDPDIIVGYNQDAFDWPYLRKRAERWNIPLD- -VG- - 
MTH1208 • FVETVATEDERELLERFAEIVIDKKPDILVGYKSDNFDFPYITRRAAILGAELD- - LG-- 
PHBT047 - YVEWSSEREMIKRLIRVIKEKDPDVIITYNGDNFDFPYLLKRAEK1X3 1/3- - 

MJ0885 : NIEWKNEKELIKKIIETLKEY- - DVI YTYNGDNFDFP YLKARAKIYG IDIN - - LG— 



58 
54 
54 
54 

52 



DPOD_HUMAN 
DPOL_ARCFU 
MTH1208 
PHBT047 -. 
MJ0885 



60 * 80 * 100 * 

AGLCSNIRDSSFQSKQTGRROTKWSMVGRVQMDMLQVLL^ 

RDGSNWFRGG RPKITGRLNVDLYDIAMRISDIKIKKLENVAEFLG 

WDG SKIRTMRRG - FANATAIKGTVHVDLYPVMRRYMNLDRYTLERVYQELF 

RDNSEPKMQKMG-DSLAVEIKGRIHFDLFPVIRRTINLPTYTLEAVYEAIF 

' KDGEELKIKRGG-MEYRSYIPGRVHIDLYPISRRLLKLTKYTLEDWYNLF 



116 
100 
104 
104 
102 



DPOD_HUMAN 

DPOL_ARCFU 

MTH1208 

PHBT047 

MJ0885 



120 * 140 * 160 * 

GEQKE - DVQHSI I TDLQNGNDQTRRRLAVYCLKDAYL PLRLLERLWLVNAVEMARVT 
TKIEIADIEAKDIYRYWSRGE — KEKVLNYARQDAINTYLIAK- - ELLPMHYELSKMI 
GEEKI-DLPGDRLWEYWDRDEL-RDELFRYSLDDWATHRIAE--KILPLNLELTRLV 
GKPKE- KVYADEIAKAWETGEG - LERVAKYSMEDAKVTYELGR — EFFPMEAQLARLV 
G IEKL-KIPHTKIVDYWANND- - -KTLIEYSLQDAKYTYKIGK- - YFFPLEVMFSRIV 



173 
154 
158 
158 
154 



DPOD_HUMAN 

DPOL_ARCFU 

MTH1208 

PHBT047 

MJ0885 



180 * 200 * 220 * 

GVPLSYLLSRGQQVKWSQLLRQAMHEGLLMPWKSE GGEDYTGATVTEPLK 

RLPVDDVTRMGRGKQVDWLLL SEAKKIGEI APNPPE HAESYEGAFVLEPER 

GQPLFDISRMATGQQAEWFLVRKAYQYGELVPNKPSQSDFSSRRGRRAVGGYVKEPEK 
G QPVTOVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKEYERRLRE S YEGG YVKEPEK 
NQTPFEITRMSSGQMVEYLI^IKRAFKEIMIVPl^ 



225 
205 
216 
216 
212 



DPOD_HUMAN 

DPOL_ARCFU 

MTH1208 

PHBT047 

MJ0885 



240 

GYYDVPIATLDFS : 238 

G LHEN- VACLDF A : 217 

GLHEN- IVQFDFR : 228 

GLWEG- IVSLDFR : 228 

GMFED- 1 ISMDFR : 224 
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AF1722 

MJ1630 

P£uORF3 

MTH1536 

PHBN021 



* 20 * 40 * 60 

DT IKGVKGMTSKTKI PERLEKG ILRVKHGVFVFKDGTARFDATDLP ITHFKP AEIGVSVEKLR : 63 

GDVKCIKGMTSKQKIVEPLEKAILRAINEVY^ : 63 

DKLKGVMGMTSGWKI AEPLEKGLLRAKNEVYVFKDGT IRFDATDAP ITHFRPRE IGVSVEKLR : 63 

DEIKGVEGM I SAEKFPEPLEKG I LRAKNDVYTFKDAT IRHDSTDLPLTHFTPREVGVSVERLR : 63 

DKIJCG VMGMTSGWKMPEPLEKGLLRAK1TOVY ITHFRPRE IGVSVEKLR : 63 



* 80 * 100 * 120 

AF1722 : EI^YERDYKGAELKNENQI^I^PQDVILPKSGAEYLI^VANFIDDLL : 126 

MJ1630 : EU3YDKDIYGNELVTCEQV\reLKPQI^IPE : 126 

PfuORF3 : ELGYTHDFEGKPLVSEDQIVELKPQDVILSKEAGKYLLRVARFVDDLLEKFYGLPRFYNAEKM : 126 

MTH1536*- ELGYTRDCYGDELEDEDQILELRVQDWISEDCADYLVRVANFVDDLLERFYDLERFYNVKTR : 126 

PHBN021 : ELGYTHDFEGNPLVSEDQIVELKPQDIILSKEAGKYLLKVAKFVDDLLEKFYGLPRFYNAEKM : 126 

* 140 * 160 * 

AF1722 : EDLIGHLVIGLAPHTSAGVLGRI IGFSDVLAGYAHPYFHAAKRR : 170 

MJ1630 : EDLIGHLVIGMAPHTSAGMVGRI IG YTKANVGYAHPYFHAAKRR : 170 

PfuORF3 : EDL IGHLV IGLA P HTSAG IVGRI IGFVDALVG YAHP YFHAAKRR : 170 

MTH1536 : EDLVGHLIAGLAPHTSAAVLGRIIGFTGASACYAHPYFHSAKRR : 170 

PHBN021 : EDL IGHLVIGLAPHTSAG IVGRI IGFVDALVG YAHP YFHAAKRR : 170 



Abbildung 19: 



DP3A_ECOLI 

DP3A_SALTY 

BB0579 

DP3A_HELPY 

AA50 



* 20 * 40 * 60 

ELQVINQMGFPGYFLIVMEFIQWSKDNGVPVGPGRGSGAGSLVAYALKITDLDPLEFDLL : 6 0 

ELQVINQMGFPG YFLIVMEF IQWSKDNGVPVG PGRG SGAG SLVAYALKITDLDPLEFDLL : 6 0 

ELSVT IGMG FEG YFLXVWDF IKFAHDND IPVGAGRG SG AG S IVAYALRITDIDPLKYNLL : 60 

EIEVITNMKFPGYMLIVWDFIRYAKEMGIPVGPGRGSAAGSLVAFALKITDIDPLKYDLL : 60 

ELEVINKMGFAGYFLIVQDFINWAKKNDIPVGPGRGSAGGSLVAYAIGITDVDPIKHGFL : 60 



DP3A_EC0LI 

DP3A.SALTY 

BB0579 

DP3A_HELPY 

AA50 



* 80 * 100 * 120 

FE^LNPERVSMPDFDVDFCMEKRDQVIEHVADMYGRDAVSQIITFGTMAAKAVIRDVGR : 120 

FERFLJ^PERVSMPDFDVDFCMEKRDQVIEHVADMYGRDAVSQIITFGTMAAKAVIRDVGR : 120 

FERFLNPERISMPDFDIDFCFEGRDEIIKYVimYGEDKVAQIITFGTLKPKAVVKDVAR : 120 

FERFLNPERISMPDIDTDFCQRRRKEIIEYMIE3CYGKYWAQVITFNKMLAKGVIRDVAR : 120 

FERFLNPERVSMPDIDVDFCQDNREKVI EYVRNKYGHDNVAQ I ITYNVMKAKQTLRDVAR : 120 



DP3A_ECOLI : VLGHPYGFVDRISKLIPP : 138 

DP3A_SALTY : VLG HP YGFVDRI SKLVPP : 13 B 

BB0579 : VLDIPFAESNELTKFIPD : 138 

DP3A_HELPY : VLDMPYKEADDFAKLIPN : 138 

AA50 : AMGLPYSTADKLAKLIPQ : 138 
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Abstract 



A thermostable in vitro complex for template-dependent elongation of nucleic acids compnses a 
thermostable sliding clamp protein, which is connected with an elongation protein that shows thermostable 
Dolvmerase activity is new. Independent claims are also included for the following: (1) a thermostable 
accessory in vitro complex characterized in that it contains a sliding clamp protein and a coupling protein, as 
defined above- (2) a recombinant DNA sequence, which encodes a thermostable in vitro complex or a 
thermostable accessory complex; (3) a vector that contains recombinant DNA encoding a sliding clamp 
Drotein and a coupling protein and/or an elongation protein; (4) a host cell transformed with one or more 
vectors of (3)- (5) a method for the production of a thermostable in vitro complex or thermostable m vitro 
accessory complex as above; (6) a method for template-dependent elongation of nucleic acids; (7) a method 
of marking nucleic acids through generating a single break in the phosphodiester bond of the nucleic acid 
chain and substituting a nucleotide at the break site with a marked nucleotide with the help of a polymerase, 
where the polymerase is a thermostable in vitro complex as above; and (8) a reagent kit for elongation 
and/or amplification and/or reverse-transcription and/or sequencing and/or marking of nucleic acids. 
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